Erinevus süvaõppimise ja masinõppe vahel võrreldes tehisintellektiga

Mis on tehisintellekt?

AI (tehisintellekt) on arvutiteaduse haru, milles masinad programmeeritakse ja neile antakse kognitiivne võime mõelda ja matkida tegevusi nagu inimesed ja loomad. Tehisintellekti võrdlusalus on inimese intelligentsus arutluste, kõne, õppimise, nägemise ja probleemide lahendamise osas, mis on tulevikus kaugel.

Tehisintellektil on kolm erinevat taset:

Kitsas tehisintellekt : tehisintellekt on kitsas, kui masin suudab konkreetset ülesannet paremini täita kui inimene. Tehisintellekti praegused uuringud on siin
Üldine tehisintellekt : tehisintellekt jõuab üldise seisundini, kui ta suudab täita mis tahes intellektuaalset ülesannet sama täpsustasemega, nagu inimene teeks
Aktiivne tehisintellekt : tehisintellekt on aktiivne, kui suudab inimesi paljude ülesannetega võita

Varasetes tehisintellekti süsteemides kasutati mustrite sobitamist ja ekspertsüsteeme.

Selles õpetuses saate teada

Mis on tehisintellekt?
Mis on ML?
Mis on sügav õppimine?
Masinõppeprotsess
Sügav õppeprotsess
Automatiseerige funktsioonide eraldamine DL-i abil
Masinõppe ja sügava õppimise erinevus
Millal kasutada ML või DL?

Mis on ML?

ML (masinõpe) on tehisintellekti tüüp, mille puhul arvutit õpetatakse automatiseerima ülesandeid, mis on inimese jaoks ammendavad või võimatud. See on parim algoritm andmete analüüsimiseks, mõistmiseks ja tuvastamiseks arvutialgoritmide uurimise põhjal. Masinõppega saab otsuseid langetada inimese minimaalse sekkumisega.

Tehisintellekti ja masinõppe võrdlemisel kasutab masinõpe andmeid algoritmi sisestamiseks, mis suudab mõista sisendi ja väljundi suhet. Kui masin on õppimise lõpetanud, saab ta ennustada uue andmepunkti väärtust või klassi.

Mis on sügav õppimine?

Sügav õppimine on arvutitarkvara, mis jäljendab aju neuronite võrku. See on masinõppe alamhulk ja seda nimetatakse sügavaks õppimiseks, kuna see kasutab sügavaid närvivõrke. Andmetest õppimiseks kasutab masin erinevaid kihte. Mudeli sügavust tähistab kihtide arv mudelis. Sügav õppimine on tehisintellekti uusim tipp. Sügavas õppimises toimub õppefaas läbi närvivõrgu. Närvivõrk on arhitektuur, kus kihid on üksteise peale laotud

Masinõppeprotsess

Kujutage ette, et teie eesmärk on luua programm, mis tunneb ära objektid. Mudeli koolitamiseks kasutate klassifikaatorit . Klassifikaator kasutab objekti tunnuseid, et proovida tuvastada klassi, kuhu see kuulub.

Selles näites õpetatakse klassifikaatorit tuvastama, kas pilt on:

Jalgratas
Paat
Auto
Lennuk

Neli ülaltoodud objekti on klass, mille klassifikaator peab ära tundma. Klassifikaatori koostamiseks peate sisestama mõned andmed ja määrama neile sildi. Algoritm võtab need andmed, leiab mustri ja liigitab need seejärel vastavasse klassi.

Seda ülesannet nimetatakse juhendatud õppeks. Juhendatud õppes sisaldab algoritmi sisestatud treeninguandmed silti.

Algoritmi koolitamiseks tuleb järgida mõnda standardset sammu:

Koguge andmeid
Treenige klassifikaatorit
Tehke ennustusi

Esimene samm on vajalik, õigete andmete valimine muudab algoritmi edukaks või ebaõnnestunuks. Andmeid, mille valite mudeli koolitamiseks, nimetatakse funktsiooniks. Objektinäites on funktsioonid piltide pikslid.

Iga pilt on andmetes rida, iga piksel aga veerg. Kui teie pilt on 28x28 suurune, sisaldab andmekogum 784 veergu (28x28). Alloleval pildil on iga pilt muudetud tunnusvektoriks. Silt ütleb arvutile, milline objekt on pildil.

Eesmärk on kasutada neid treeningandmeid objekti tüübi klassifitseerimiseks. Esimene samm koosneb funktsiooniveergude loomisest. Seejärel hõlmab teine samm mudeli koolitamiseks algoritmi valimist. Kui treening on tehtud, ennustab mudel, milline pilt mis objektile vastab.

Pärast seda on mudelit uute piltide ennustamiseks lihtne kasutada. Iga uue mudelisse sisestatud pildi jaoks ennustab masin klassi, kuhu see kuulub. Näiteks läbib mudelit täiesti uus pilt ilma sildita. Inimese jaoks on tühine kujutise visualiseerimine autona. Masin kasutab oma varasemaid teadmisi, et ennustada ka seda, et pilt on auto.

Sügav õppeprotsess

Sügavas õppimises toimub õppefaas läbi närvivõrgu. Närvivõrk on arhitektuur, kus kihid on üksteise peale laotud.

Vaatleme sama pildinäidet ülal. Treeningukomplekt suunataks närvivõrku

Iga sisend läheb neuronisse ja korrutatakse kaaluga. Korrutamise tulemus voolab järgmisele kihile ja muutub sisendiks. Seda protsessi korratakse võrgu iga kihi jaoks. Lõplik kiht nimetatakse väljundkihiks; see annab regressioonülesande tegeliku väärtuse ja klassifitseerimisülesande iga klassi tõenäosuse. Närvivõrk kasutab matemaatilise algoritmi abil kõigi neuronite kaalu uuendamiseks. Närvivõrk on täielikult koolitatud, kui kaalude väärtus annab reaalsusele lähedase väljundi. Näiteks suudab hästi koolitatud närvivõrk pildil oleva objekti ära tunda suurema täpsusega kui traditsiooniline närvivõrk.

Automatiseerige funktsioonide eraldamine DL-i abil

Andmekogum võib sisaldada tosinat kuni sadat funktsiooni. Süsteem õpib nende funktsioonide asjakohasusest. Kuid kõik funktsioonid pole algoritmi jaoks tähendusrikkad. Masinõppe ülioluline osa on leida asjakohane funktsioonide komplekt, mis paneks süsteemi midagi õppima.

Üks viis selle osa täitmiseks masinõppes on funktsioonide ekstraktimise kasutamine. Funktsioonide väljavõtmine ühendab olemasolevad funktsioonid asjakohasemate funktsioonide kogumi loomiseks. Seda saab teha PCA, T-SNE või mõne muu mõõtmete vähendamise algoritmiga.

Näiteks pilditöötluse korral peab praktiseerija pildil funktsiooni käsitsi ekstraheerima nagu silmad, nina, huuled ja nii edasi. Need eraldatud tunnused on klassifikatsioonimudeli lähtekohaks.

Sügav õppimine lahendab selle probleemi, eriti konvolutsioonilise närvivõrgu puhul. Närvivõrgu esimene kiht õpib pildilt väikseid detaile; järgmised kihid ühendavad varasemad teadmised keerukama teabe saamiseks. Konvolutsioonilises närvivõrgus toimub funktsioonide eraldamine filtri abil. Võrk rakendab pildile filtri, et näha, kas see on vaste, st funktsiooni kuju on identne pildi osaga. Kui on vaste, kasutab võrk seda filtrit. Funktsioonide väljavõtmine toimub seetõttu automaatselt.

Masinõppe ja sügava õppimise erinevus

Allpool on peamine erinevus süvaõppe ja masinõppe vahel

	Masinõpe	Sügav õppimine
Andmesõltuvus	Suurepärased jõudlused väikeses / keskmises andmekogumis	Suurepärane jõudlus suures andmekogumis
Riistvarasõltuvused	Töötage madalama hinnaga masinal.	Nõuab võimsat masinat, eelistatavalt koos GPU-ga: DL teostab märkimisväärse hulga maatriksi korrutamist
Funktsioonitehnika	Vaja mõista andmeid esindavaid funktsioone	Pole vaja mõista parimat funktsiooni, mis andmeid esindab
Täitmise aeg	Mõni minut kuni tund	Kuni nädalateni. Neural Network peab arvutama märkimisväärse arvu kaalu
Tõlgendatavus	Mõnda algoritmi on lihtne tõlgendada (logistika, otsustuspuu), mõnda on peaaegu võimatu (SVM, XGBoost)	Raske kuni võimatu

Millal kasutada ML või DL?

Alljärgnevas tabelis võtame näidetega kokku masinõppe ja süvaõppe erinevuse.

	Masinõpe	Sügav õppimine
Koolituse andmekogum	Väike	Suur
Valige funktsioonid	Jah	Ei
Algoritmide arv	Palju	Vähesed
Treeningu aeg	Lühike	Pikk

Masinõppe korral vajate algoritmi koolitamiseks vähem andmeid kui sügavat õppimist. Sügav õppimine nõuab alusstruktuuri tuvastamiseks ulatuslikku ja mitmekesist andmekogumit. Pealegi pakub masinõpe kiiremini koolitatud mudelit. Kõige arenenum süvaõppe arhitektuur võib treenimiseks võtta päevi kuni nädala. Sügava õppimise eelis masinõppe ees on see, et see on ülitäpne. Te ei pea mõistma, millised funktsioonid kujutavad andmeid kõige paremini; närvivõrk õppis kriitiliste tunnuste valimist. Masinõppes peate ise valima, millised funktsioonid mudelisse lisada.

Kokkuvõte

Tehisintellekt annab masinale tunnetusvõime. Tehisintellekti ja masinõppe võrdlemisel kasutati varases tehisintellektisüsteemis mustrite sobitamist ja ekspertsüsteeme.

Masinõppe idee on see, et masin saab õppida ilma inimese sekkumiseta. Masin peab leidma viisi, kuidas õppida andmetega antud ülesannet lahendama.

Sügav õppimine on tehisintellekti valdkonnas läbimurre. Kui treenimiseks on piisavalt andmeid, saavutab sügav õppimine muljetavaldavaid tulemusi, eriti piltide tuvastamise ja teksti tõlkimise osas. Peamine põhjus on see, et funktsioon ekstraheeritakse võrgu erinevates kihtides automaatselt.