Mis on juhendatud masinõpe?
Juhendatud õppes treenite masinat, kasutades selleks andmeid, mis on hästi märgistatud . See tähendab, et mõned andmed on juba märgitud õige vastusega. Seda saab võrrelda õppimisega, mis toimub juhendaja või õpetaja juuresolekul.
Juhendatud õppealgoritm õpib sildistatud treeningandmetest, aitab ennustada ettenägematute andmete tulemusi.
Täpsete juhendatud masinõppemudelite edukas koostamine, skaleerimine ja juurutamine nõuab kõrge kvalifikatsiooniga andmeteadlaste meeskonnalt aega ja tehnilisi teadmisi. Pealegi peab andmeteadlane mudeleid ümber ehitama, et veenduda, et antud teadmised jäävad tõeks kuni andmete muutumiseni.
Selles õpetuses saate teada:
- Mis on juhendatud masinõpe?
- Kuidas juhendatud õpe töötab
- Juhendatud masinõppe algoritmide tüübid
- Juhendatud või järelevalveta masinõppevõtted
- Väljakutsed juhendatud masinõppes
- Juhendatud õppimise eelised:
- Juhendatud õppe puudused
- Parimad tavad juhendatud õppimiseks
Kuidas juhendatud õpe töötab
Näiteks soovite koolitada masinat, mis aitab teil ennustada, kui kaua kulub teil töökohast koju sõitmiseks. Alustuseks loote sildistatud andmete komplekti. Need andmed hõlmavad järgmist
- Ilmastikutingimused
- Kellaaeg
- Pühad
Kõik need üksikasjad on teie sisendid. Väljund on aeg, mis kulus sel konkreetsel päeval koju tagasi sõitmiseks.
Teate vaistlikult, et kui väljas sajab vihma, siis võtab teil koju sõitmine kauem aega. Kuid masin vajab andmeid ja statistikat.
Vaatame nüüd, kuidas saate selle näite abil välja töötada juhendatud õppemudeli, mis aitab kasutajal määrata edasi-tagasi sõiduaega. Esimene asi, mida peate looma, on treeningukomplekt. See treeningukomplekt sisaldab kogu edasi-tagasi sõiduaega ja vastavaid tegureid, nagu ilm, aeg jne. Selle treeningkomplekti põhjal võib teie masin näha, et vihma hulga ja koju jõudmiseks kuluva aja vahel on otsene seos.
Niisiis saab see kindlaks, et mida rohkem vihma sajab, seda kauem sõidate koju tagasi jõudmiseks. See võib näha ka seost töölt lahkumise ja teel viibimise aja vahel.
Mida lähemal olete kella 18-le, seda kauem kulub teil koju jõudmiseks. Teie masin võib leida mõned seosed teie siltidega andmetega.
See on teie andmemudeli algus. See hakkab mõjutama seda, kuidas vihm mõjutab inimeste juhtimist. Samuti hakkab nägema, et kindlal kellaajal reisib rohkem inimesi.
Juhendatud masinõppe algoritmide tüübid
Regressioon:
Regressioonitehnikaga ennustatakse treeninguandmete abil üks väljundväärtus.
Näide : saate kasutada regressiooni, et koolituse andmete põhjal maja hinda ennustada. Sisendmuutujadeks on asukoht, maja suurus jne.
Tugevad küljed : väljunditel on alati tõenäosuslik tõlgendus ja algoritmi saab seadistada, et vältida üleliigset paigaldamist.
Nõrgad küljed : Logistiline regressioon võib alatõhustada, kui on mitu või mittelineaarset otsustamispiiri. See meetod ei ole paindlik, seega ei hõlma see keerukamaid suhteid.
Logistiline regressioon:
Logistilise regressiooni meetod, mida kasutatakse diskreetsete väärtuste hindamiseks sõltumatute muutujate hulga põhjal. See aitab teil prognoosida sündmuse toimumise tõenäosust, sobitades andmed logit-funktsioonile. Seetõttu on see tuntud ka kui logistiline regressioon. Kuna see ennustab tõenäosust, jääb selle väljundväärtus vahemikku 0 ja 1.
Siin on mõned regressioonialgoritmide tüübid
Klassifikatsioon:
Klassifikatsioon tähendab väljundi rühmitamist klassi sees. Kui algoritm üritab sisendit märgistada kahte erinevasse klassi, nimetatakse seda binaarseks klassifikatsiooniks. Rohkem kui kahe klassi vahel valimist nimetatakse mitmeklassi klassifikatsiooniks.
Näide : selle kindlaksmääramine, kas keegi jääb laenu maksmata jätjaks või mitte.
Tugevad küljed : Klassifikatsioonipuu toimib praktikas väga hästi
Nõrkused : piiranguteta, üksikud puud on altid üle passima.
Siin on mõned liigitusalgoritmide tüübid
Naiivsed Bayesi klassifikaatorid
Naiivset Bayesi mudelit (NBN) on lihtne ehitada ja see on suurte andmekogumite jaoks väga kasulik. See meetod koosneb otsestest atsüklilistest graafikutest, kus on üks vanem ja mitu last. See eeldab vanemast eraldatud lastesõlmede sõltumatust.
Otsustuspuud
Otsustuspuud klassifitseerivad eksemplari, sorteerides need funktsiooni väärtuse alusel. Selles meetodis on iga režiim eksemplari funktsioon. See peaks olema klassifitseeritud ja iga haru tähistab väärtust, mille sõlm võib eeldada. See on klassifitseerimiseks laialt kasutatav tehnika. Selles meetodis on klassifikatsioon puu, mida tuntakse otsustuspuuna.
See aitab teil hinnata tegelikke väärtusi (auto ostukulu, kõnede arv, kuu kogumüük jne).
Toetage vektormasinat
Tugivektorimasin (SVM) on 1990. aastal välja töötatud õppimisalgoritmide tüüp. See meetod põhineb Vap Nik'i kasutusele võetud statistilise õppeteooria tulemustel.
SVM-masinad on tihedalt seotud ka tuumafunktsioonidega, mis on enamiku õppeülesannete keskne mõiste. Kerneli raamistikku ja SVM-i kasutatakse erinevates valdkondades. See hõlmab multimeediumiteabe otsimist, bioinformaatikat ja mustrituvastust.
Juhendatud või järelevalveta masinõppevõtted
Põhineb | Juhendatud masinõppe tehnika | Järelevalveta masinõppe tehnika |
Sisendandmed | Algoritme koolitatakse sildistatud andmete abil. | Algoritme kasutatakse andmete suhtes, mis pole sildistatud |
Arvutuslik keerukus | Juhendatud õppimine on lihtsam meetod. | Järelevalveta õppimine on arvutuslikult keeruline |
Täpsus | Väga täpne ja usaldusväärne meetod. | Vähem täpne ja usaldusväärne meetod. |
Väljakutsed juhendatud masinõppes
Järgnevalt on väljakutsed masinaõppimisel:
- Asjakohased sisendfunktsiooni olemasolevad koolitusandmed võivad anda ebatäpseid tulemusi
- Andmete ettevalmistamine ja eeltöötlus on alati väljakutse.
- Täpsus kannatab siis, kui treeninguandmeteks on sisestatud võimatu, ebatõenäoline ja mittetäielikud väärtused
- Kui asjassepuutuvat eksperti pole saadaval, on teine lähenemisviis "jõhker jõud". See tähendab, et peate mõtlema, et õiged funktsioonid (muutujad) masina treenimiseks. See võib olla ebatäpne.
Juhendatud õppimise eelised:
- Juhendatud õppimine võimaldab teil koguda andmeid või toota varasema kogemuse põhjal andmeid
- Aitab teil kogemuste abil toimivuskriteeriume optimeerida
- Juhendatud masinõpe aitab teil lahendada mitmesuguseid reaalsete arvutuste probleeme.
Juhendatud õppe puudused
- Otsuse piir võib olla üle treenitud, kui teie treeningkomplektil pole näiteid, mida soovite klassis omada
- Klassifikaatori koolitamise ajal peate igast klassist valima palju häid näiteid.
- Suurandmete salastamine võib olla tõeline väljakutse.
- Juhendatud õppimise koolitus vajab palju arvutusaega.
Parimad tavad juhendatud õppimiseks
- Enne millegi muu tegemist peate otsustama, milliseid andmeid treeningukomplektina kasutatakse
- Peate otsustama õpitud funktsiooni struktuuri ja õppimisalgoritmi.
- Gathere vastavad väljundid kas inimekspertidelt või mõõtmistelt
Kokkuvõte
- Juhendatud õppes treenite masinat, kasutades selleks andmeid, mis on hästi märgistatud.
- Soovite koolitada masinat, mis aitab teil ennustada, kui kaua kulub teil töökohalt koju sõitmiseks. See on näide juhendatud õppest
- Regressioon ja klassifikatsioon on kahte tüüpi juhendatud masinõppe tehnikaid.
- Juhendatud õpe on lihtsam meetod, järelevalveta õppimine aga keeruline meetod.
- Juhendatud õppimise suurim väljakutse on see, et ebaoluline sisendfunktsioon, mis sisaldab koolituse andmeid, võib anda ebatäpseid tulemusi.
- Juhendatud õppe peamine eelis on see, et see võimaldab teil koguda andmeid või toota varasemast kogemusest saadud andmete väljundit.
- Selle mudeli puuduseks on see, et otsustamispiir võib olla üle pingutatud, kui teie treeningkomplektil pole näiteid, mida soovite klassis omada.
- Õppimise juhendamise parima tavana peate kõigepealt otsustama, milliseid andmeid tuleks koolituskomplektina kasutada.