Sisällysluettelo
- Deep Learning -projekti-ideat
- Deep Learning -projekti-ideat: Beginners Level
- Image Classification with CIFAR-10 dataset
- Visuaalinen seurantajärjestelmä
- Kasvojen havaitsemisjärjestelmä
- Syväoppimisprojekti-ideoita: Intermediate Level
- Digit Recognition System
- Chatbot
- Musiikin genre-luokittelujärjestelmä
- Uneliaisuuden havainnointijärjestelmä Kuljettajien uneliaisuus on yksi tärkeimpiä tieliikenneonnettomuuksien taustalla olevia syitä. On luonnollista, että kuljettajat, jotka kulkevat pitkiä matkoja, torkahtavat ratin takana. Myös stressi ja unenpuute voivat aiheuttaa kuljettajille uneliaisuutta ajon aikana. Tämän hankkeen tavoitteena on ehkäistä ja vähentää tällaisia onnettomuuksia luomalla uneliaisuuden havaitsemisagentti.
- Image caption generator
- Vanhojen B&W-kuvien värittäminen
- Deep Learning Project Ideas – Advanced Level
- Detectron
- WaveGlow
- OpenCog
- DeepMimic
- IBM Watson
- Google Brain
- 12 Sigman keuhkosyövän havaitsemisalgoritmi
- Johtopäätös
Deep Learning -projekti-ideat
Syväluennan (Deep Learning) soveltamisala laajenee räjähdysmäisesti, vaikkakin kyseessä on uusi teknologinen edistysaskel. Deep Learning -teknologia pyrkii jäljittelemään biologista hermoverkkoa eli ihmisen aivoja. Vaikka Deep Learningin alkuperä juontaa juurensa 1950-luvulle, se on noussut parrasvaloihin vasta tekoälyn ja koneoppimisen kehittymisen ja käyttöönoton myötä. Jos siis olet ML:n aloittelija, parasta, mitä voit tehdä, on työstää joitakin Deep Learning -projekti-ideoita.
Me täällä upGradissa uskomme käytännönläheiseen lähestymistapaan, sillä pelkkä teoreettinen tieto ei auta reaaliaikaisessa työympäristössä. Tässä artikkelissa tutustumme joihinkin mielenkiintoisiin syväoppimisprojekti-ideoihin, joiden parissa aloittelijat voivat työskennellä ja laittaa tietonsa koetukselle. Tästä artikkelista löydät aloittelijoille suunnattuja parhaita syväoppimisprojekti-ideoita, joiden avulla he voivat saada käytännön kokemusta syväoppimisesta.
Syväoppiminen on koneoppimisen osajoukko, joka hyödyntää hierarkkisesti järjestettyjä keinotekoisia neuroverkkoja tiettyjen ML-tehtävien suorittamiseen. Deep Learning -verkot käyttävät valvomatonta oppimismenetelmää – ne oppivat strukturoimattomasta tai merkitsemättömästä datasta. Keinotekoiset neuroverkot ovat kuin ihmisen aivot, ja neuronisolmut ovat yhteydessä toisiinsa muodostaen verkkomaisen rakenteen.
Vaikka perinteiset oppimismallit analysoivat dataa lineaarisella lähestymistavalla, Deep Learning -järjestelmien hierarkkinen toiminta on suunniteltu käsittelemään ja analysoimaan dataa epälineaarisella lähestymistavalla.
Deep Learning -arkkitehtuurit, kuten syvät neuroverkot, rekurrenssia neuroverkot ja syvät uskomusverkot, ovat löytäneet sovelluksia monilla eri aloilla, kuten luonnollisen kielen prosessoinnissa, tietokonenäkymässä, bioinformatiikassa, puheentunnistuksessa, äänentunnistuksessa, konekääntämisessä, sosiaalisten verkostojen suodatuksessa, lääkkeiden suunnittelussa ja jopa lautapeliohjelmissa. Kun tällä alalla tehdään uusia edistysaskeleita, se auttaa ML- ja Deep Learning -asiantuntijoita suunnittelemaan innovatiivisia ja toimivia Deep Learning -projekteja. Mitä enemmän Deep Learning -projekti-ideoita kokeilet, sitä enemmän kokemusta saat.
Tänään keskustelemme seitsemästä parhaasta hämmästyttävästä Deep Learning -projektista, jotka auttavat meitä saavuttamaan uusia saavutuksia.
Tässä on siis muutama Deep Learning -projekti-idea, joiden parissa aloittelijat voivat työskennellä:
Deep Learning -projekti-ideat: Beginners Level
Tämä lista Deep Learning -projekti-ideoista opiskelijoille sopii aloittelijoille ja niille, jotka vasta aloittavat ML:n parissa yleensä. Näillä syväoppimisen projekti-ideoilla pääset liikkeelle kaikista käytännön asioista, joita tarvitset menestyäksesi urallasi.
Jos etsit syväoppimisen projekti-ideoita viimeistä vuotta varten, tämän listan pitäisi saada sinut liikkeelle. Hyppäämme siis pitemmittä puheitta suoraan muutamiin syväoppimisen projekti-ideoihin, jotka vahvistavat pohjaasi ja joiden avulla voit kiivetä tikapuita ylöspäin.
Image Classification with CIFAR-10 dataset
Yksi parhaista ideoista aloittaa kokeilut sinulle käytännönläheiset syväoppimisen projektit opiskelijoille on työskentely kuvien luokittelun parissa. CIFAR-10 on suuri tietokokonaisuus, joka sisältää yli 60 000 (32×32-kokoista) värikuvaa luokiteltuna kymmeneen luokkaan, joissa jokaisessa luokassa on 6000 kuvaa. Koulutusjoukko sisältää 50 000 kuvaa, kun taas testijoukko sisältää 10 000 kuvaa. Harjoitusjoukko jaetaan viiteen erilliseen osaan, joissa kussakin on 10 000 satunnaisesti järjestettyä kuvaa. Testijoukko sisältää 1000 kuvaa, jotka valitaan satunnaisesti jokaisesta kymmenestä luokasta.
Tässä projektissa kehität kuvien luokittelujärjestelmän, joka pystyy tunnistamaan syötetyn kuvan luokan. Kuvien luokittelu on keskeinen sovellus syväoppimisen alalla, ja näin ollen saat tietoa erilaisista syväoppimisen käsitteistä työskennellessäsi tämän projektin parissa.
Visuaalinen seurantajärjestelmä
Visuaalinen seurantajärjestelmä on suunniteltu seuraamaan ja paikantamaan liikkuva(t) kohde(t) tietyssä ajassa kameran avulla. Se on kätevä työkalu, jolla on lukuisia sovelluksia, kuten turvallisuus ja valvonta, lääketieteellinen kuvantaminen, lisätty todellisuus, liikenteenohjaus, videoeditointi ja -viestintä sekä ihmisen ja tietokoneen välinen vuorovaikutus.
Tässä järjestelmässä käytetään syväoppimisalgoritmia analysoimaan peräkkäisiä videokuvia, minkä jälkeen se jäljittää kohdeobjektien liikettä kuvien välillä. Tämän visuaalisen seurantajärjestelmän kaksi ydinkomponenttia ovat:
- Kohteen esittäminen ja paikantaminen
- Suodatus ja tietojen yhdistäminen
Kasvojen havaitsemisjärjestelmä
Tämä on yksi erinomaisista syväoppimisen projekti-ideoista aloittelijoille. Syväoppimisen edistymisen myötä myös kasvojentunnistustekniikka on kehittynyt valtavasti. Kasvontunnistustekniikka on objektintunnistuksen osajoukko, joka keskittyy semanttisten kohteiden instanssin havainnointiin. Se on suunniteltu seuraamaan ja visualisoimaan ihmiskasvoja digitaalisissa kuvissa.
Tässä syväoppimisprojektissa opit suorittamaan ihmisen kasvojen tunnistuksen reaaliajassa. Sinun on kehitettävä malli Pythonilla ja OpenCV:llä.
Syväoppimisprojekti-ideoita: Intermediate Level
Digit Recognition System
Kuten nimestä voi päätellä, tässä projektissa kehitetään digitunnistusjärjestelmä, joka pystyy luokittelemaan numeroita asetettujen kymmenlukujen perusteella. Tässä käytetään MNIST-tietokokonaisuutta, joka sisältää kuvia (koko 28 X 28).
Tässä projektissa pyritään luomaan tunnistusjärjestelmä, joka pystyy luokittelemaan numeroita 0-9 käyttäen matalan verkon ja syvän neuroverkon yhdistelmää sekä toteuttamalla logistista regressiota. Softmax-regressio tai Multinomial Logistic Regression on ihanteellinen valinta tähän projektiin. Koska tämä tekniikka on logistisen regression yleistys, se soveltuu monen luokan luokitteluun olettaen, että kaikki luokat ovat toisensa poissulkevia).
Chatbot
Tässä projektissa mallinnat chatbotin IBM Watsonin API:n avulla. Watson on malliesimerkki siitä, mitä tekoälyn avulla voimme saavuttaa. Tämän projektin ideana on valjastaa Watsonin syväoppimiskyvyt ja luoda chatbot, joka voi keskustella ihmisten kanssa aivan kuin toinen ihminen. Chatbotit ovat erittäin älykkäitä ja pystyvät vastaamaan ihmisten kysymyksiin tai pyyntöihin reaaliajassa. Tästä syystä yhä useammat yritykset kaikilla aloilla ottavat chatbotit käyttöön asiakastuki-infrastruktuurissaan.
Tämä projekti ei ole kovin haastava. Tarvitset vain Python 2/3 koneessasi, Bluemix-tilin ja tietysti aktiivisen Internet-yhteyden! Jos haluat skaalata sitä astetta suuremmaksi, voit käydä Github-arkistossa ja parantaa chatbotin ominaisuuksia sisällyttämällä animoidun auton kojelaudan.
Lue: Kuinka tehdä chatbot Pythonilla?
Musiikin genre-luokittelujärjestelmä
Tämä on yksi mielenkiintoisista syväoppimisprojektin ideoista. Tämä on erinomainen projekti syväoppimisen taitojesi vaalimiseen ja parantamiseen. Luodaan syväoppimismalli, joka käyttää neuroverkkoja musiikin genren automaattiseen luokitteluun. Tässä projektissa käytät FMA (Free Music Archive) -tietokokonaisuutta. FMA on interaktiivinen kirjasto, joka koostuu laadukkaista ja laillisista äänilatauksista. Se on avoimen lähdekoodin ja helposti saatavilla oleva tietokokonaisuus, joka soveltuu erinomaisesti moniin MIR-tehtäviin, kuten laajojen musiikkikokoelmien selaamiseen ja järjestämiseen.
Muista kuitenkin, että ennen kuin voit käyttää mallia äänitiedostojen luokitteluun genren mukaan, sinun on poimittava asiaankuuluvaa tietoa ääninäytteistä (kuten spektrogrammeja, MFCC:tä jne.).
Uneliaisuuden havainnointijärjestelmä
Kuljettajien uneliaisuus on yksi tärkeimpiä tieliikenneonnettomuuksien taustalla olevia syitä. On luonnollista, että kuljettajat, jotka kulkevat pitkiä matkoja, torkahtavat ratin takana. Myös stressi ja unenpuute voivat aiheuttaa kuljettajille uneliaisuutta ajon aikana. Tämän hankkeen tavoitteena on ehkäistä ja vähentää tällaisia onnettomuuksia luomalla uneliaisuuden havaitsemisagentti.
Tässä käytät Pythonia, OpenCV:tä ja Kerasia rakentaaksesi järjestelmän, joka pystyy havaitsemaan kuljettajien suljetut silmät ja hälyttämään heidät, jos he joskus nukahtavat ajon aikana. Vaikka kuljettajan silmät olisivat kiinni muutaman sekunnin ajan, tämä järjestelmä ilmoittaa siitä välittömästi kuljettajalle ja estää näin kauheat liikenneonnettomuudet. OpenCV valvoo ja kerää kuljettajan kuvia web-kameran kautta ja syöttää ne syväoppimismalliin, joka luokittelee kuljettajan silmät ’avoimiksi’ tai ’suljetuiksi’.”
Image caption generator
Tämä on yksi trendikkäistä syväoppimisprojekti-ideoista. Tämä on Python-pohjainen syväoppimisprojekti, joka hyödyntää konvolutiivisia neuroverkkoja ja LTSM:ää (eräänlainen rekursiivinen neuroverkko) rakentaakseen syväoppimismallin, joka voi luoda kuvatekstejä kuvaan.
Kuvan kuvatekstigeneraattori yhdistää sekä tietokonenäköä että luonnollisen kielen käsittelytekniikoita analysoidakseen ja tunnistaakseen kuvan kontekstin ja kuvaillakseen niitä vastaavasti luonnollisilla ihmiskielillä (esimerkiksi englanniksi, espanjaksi, tanskaksi jne.). Tämä projekti vahvistaa tietämystäsi CNN:stä ja LSTM:stä, ja opit toteuttamaan niitä tämän kaltaisissa reaalimaailman sovelluksissa.
Vanhojen B&W-kuvien värittäminen
Pitkään B&W-kuvien automatisoitu kuvaväritys on ollut kuuma tutkimuskohde tietokonenäön ja syväoppimisen alalla. Eräässä hiljattain tehdyssä tutkimuksessa todettiin, että jos harjoittelemme hermoverkkoa laajan ja rikkaan tietokannan avulla, voimme luoda syväoppimisen mallin, joka pystyy hallusinoimaan värejä mustavalkoisessa valokuvassa.
Tässä kuvien väritysprojektissa käytetään Pythonia ja OpenCV:n DNN-arkkitehtuuria (se on koulutettu ImageNet-tietokannalla). Tavoitteena on luoda värillinen toisinto harmaasävykuvista. Tätä varten käytät valmiiksi koulutettua Caffe-mallia, prototxt-tiedostoa ja NumPy-tiedostoa.
Deep Learning Project Ideas – Advanced Level
Detectron
Detectron on Facebookin tekoälytutkimuksen (FAIR) ohjelmistojärjestelmä, joka on suunniteltu suorittamaan ja ajamaan huipputason kohteiden tunnistusalgoritmeja. Tämä Python-kielellä kirjoitettu Deep Learning -projekti perustuu Caffe2-syväoppimiskehykseen.
Detectron on ollut perustana monille hienoille tutkimushankkeille, kuten Feature Pyramid Networks for Object Detection; Mask R-CNN; Detecting and Recognizing Human-Object Interactions; Focal Loss for Dense Object Detection; Non-local Neural Networks ja Learning to Segment Every Thing, vain muutamia mainitakseni.
Detectron tarjoaa laadukkaan ja suorituskykyisen koodipohjan objektien havaitsemisen tutkimusta varten. Se sisältää yli 50 valmiiksi koulutettua mallia ja on erittäin joustava – se tukee uudenlaisen tutkimuksen nopeaa toteuttamista ja arviointia.
WaveGlow
Tämä on yksi mielenkiintoisista syväoppimisen projekti-ideoista. WaveGlow on NVIDIAn kehittämä ja tarjoama virtauspohjainen generatiivinen verkko puhesynteesiin. Se pystyy tuottamaan laadukasta puhetta melaspektogrammeista. Se yhdistää WaveNetistä ja Glow’sta saadut oivallukset helpottaakseen nopeaa, tehokasta ja laadukasta äänisynteesiä ilman automaattista regressiota.
WaveGlow voidaan toteuttaa yhden verkon avulla ja myös kouluttaa yhdellä kustannusfunktiolla. Tavoitteena on optimoida harjoitusdatan todennäköisyys, jolloin koulutusprosessi on hallittavissa ja vakaa.
OpenCog
OpenCog-projekti sisältää ydinkomponentit ja alustan tekoälyn R&D:n helpottamiseksi. Sen tavoitteena on suunnitella avoimen lähdekoodin Artificial General Intelligence (AGI) -kehys, joka pystyy tarkasti vangitsemaan ihmisaivojen arkkitehtuurin ja dynamiikan hengen. Tekoälyrobotti Sophia on yksi hienoimmista esimerkeistä AGI:stä.
OpenCog sisältää myös OpenCog Primen – kehittyneen arkkitehtuurin robottien ja virtuaalisen ruumiillistuneen kognition kehittämiseen, joka sisältää valikoiman vuorovaikutuksessa olevia komponentteja, joiden avulla voidaan synnyttää ihmisen kaltainen keinotekoinen yleinen älykkyys (AGI) koko järjestelmän emergenttinä ilmiönä.
DeepMimic
DeepMimic on ”esimerkkiohjattu fysiikkaan perustuvien hahmotaitojen syvä vahvistusoppiminen”. Toisin sanoen se on hermoverkko, joka on koulutettu vahvistusoppimista hyödyntämällä toistamaan liikkeestä taltioituja liikkeitä simuloidun humanoidin tai minkä tahansa muun fyysisen agentin kautta.
DeepMimicin toiminta on melko yksinkertaista. Ensin on luotava simulaatio kohteesta, jota haluat animoida (voit kaapata jonkun tekemään tiettyjä liikkeitä ja yrittää jäljitellä sitä). Nyt käytät liikkeenkaappausdataa hermoverkon kouluttamiseen vahvistusoppimisen avulla. Tässä syötteenä on käsien ja jalkojen konfiguraatio eri aikapisteissä, kun taas palkkio on ero todellisen asian ja simulaation välillä tietyissä aikapisteissä.
IBM Watson
Yksi erinomaisimmista esimerkeistä koneoppimisesta ja syväoppimisesta on IBM Watson. IBM Watsonin hienointa antia on se, että sen avulla datatieteilijät ja ML-insinöörit/kehittäjät voivat tehdä yhteistyötä integroidulla alustalla tekoälyn elinkaaren tehostamiseksi ja automatisoimiseksi. Watson voi yksinkertaistaa, nopeuttaa ja hallita tekoälyn käyttöönottoja, jolloin yritykset voivat hyödyntää sekä ML:n että Deep Learningin potentiaalia liiketoiminnan arvon kasvattamiseksi.
IBM Watson on integroitu Watson Studion kanssa, jotta monialaiset tiimit voivat ottaa käyttöön, valvoa ja optimoida ML/Deep Learning -malleja nopeasti ja tehokkaasti. Se voi luoda automaattisesti API-rajapintoja, joiden avulla kehittäjät voivat sisällyttää tekoälyn helposti sovelluksiinsa. Sen lisäksi siinä on intuitiiviset kojelaudat, joiden avulla tiimit voivat kätevästi hallita malleja tuotannossa saumattomasti.
Google Brain
Tämä on yksi erinomaisista syväoppimisprojekti-ideoista. Google Brain -projekti on syväoppimisen tekoälytutkimus, joka alkoi vuonna 2011 Googlella. Google Brain -tiimi, jota johtivat Google Fellow Jeff Dean, Googlen tutkija Greg Corrado ja Stanfordin yliopiston professori Andrew Ng, pyrki tuomaan syväoppimisen ja koneoppimisen ulos laboratorion rajoista reaalimaailmaan. He suunnittelivat yhden suurimmista ML:n neuroverkoista – se koostui 16 000 yhteen kytketystä tietokoneprosessorista.
Testaamaan näin massiivisen kokoisen neuroverkon kykyjä Google Brain -tiimi syötti verkolle satunnaisia pikkukuvia kissakuvista, jotka oli saatu 10 miljoonasta YouTube-videosta. Juju on kuitenkin siinä, että he eivät kouluttaneet järjestelmää tunnistamaan, miltä kissa näyttää. Älykäs järjestelmä jätti kuitenkin kaikki hämmästyneiksi – se opetti itseään tunnistamaan kissat ja jatkoi kissan piirteiden kokoamista kissan kuvan täydentämiseksi!
Google Brain -projekti osoitti menestyksekkäästi, että ohjelmistopohjaiset neuroverkot voivat jäljitellä ihmisaivojen toimintaa, jossa jokainen neuroni koulutetaan havaitsemaan tiettyjä kohteita. How Deep Learning Algorithms are Transforming Our Everyday Lives
12 Sigman keuhkosyövän havaitsemisalgoritmi
12 Sigma on kehittänyt tekoälyalgoritmin, joka voi vähentää keuhkosyöpään liittyviä diagnoosivirheitä sen varhaisvaiheessa ja havaita keuhkosyövän merkkejä paljon nopeammin kuin perinteiset lähestymistavat.
Sigma Technologiesin perustajan ja toimitusjohtajan Xin Zhongin mukaan tavallisesti perinteiset syövän havaitsemismenetelmät vievät aikaa keuhkosyövän havaitsemiseen. 12 Sigman tekoälyalgoritmijärjestelmä voi kuitenkin lyhentää diagnoosiaikaa, mikä johtaa keuhkosyöpäpotilaiden parempaan selviytymisprosenttiin.
Yleensä lääkärit diagnosoivat keuhkosyövän tutkimalla huolellisesti tietokonetomografiakuvia pienten kyhmyjen löytämiseksi ja luokittelemalla ne hyvän- tai pahanlaatuisiksi. Lääkäreiltä voi kulua yli kymmenen minuuttia potilaan tietokonetomografiakuvien visuaaliseen tarkasteluun kyhmyjen varalta, minkä lisäksi kyhmyjen luokitteluun hyvän- tai pahanlaatuisiksi voi kulua lisäaikaa.
On sanomattakin selvää, että inhimillisten virheiden mahdollisuus on aina suuri. 12 Sigma väittää, että sen tekoälyalgoritmi pystyy tarkastamaan CT-kuvat ja luokittelemaan kyhmyt kahdessa minuutissa.
Johtopäätös
Tässä artikkelissa olemme käsitelleet parhaita syväoppimisen projekti-ideoita. Aloitimme joillakin aloittelijaprojekteilla, jotka voit ratkaista helposti. Kun olet saanut nämä yksinkertaiset projektit valmiiksi, ehdotan, että palaat takaisin, opit muutaman käsitteen lisää ja kokeilet sitten keskitason projekteja. Kun tunnet itsesi varmaksi, voit sitten tarttua edistyneisiin projekteihin. Jos haluat parantaa syväoppimisen taitojasi, sinun on saatava käsiisi nämä syväoppimisen projekti-ideat.
Nämä ovat vain kourallinen tähän mennessä tehtyjä syväoppimisen reaalimaailman sovelluksia. Teknologia on vielä hyvin nuori – se kehittyy parhaillaan. Syväoppimisella on valtavat mahdollisuudet synnyttää uraauurtavia innovaatioita, jotka voivat auttaa ihmiskuntaa vastaamaan joihinkin reaalimaailman perustavanlaatuisiin haasteisiin.
Jos olet kiinnostunut tietämään lisää syväoppimisesta ja tekoälystä, tutustu PG Diploma in Machine Learning and AI -ohjelmaamme, joka on suunniteltu työelämän ammattilaisille ja sisältää yli 450 tuntia tiukkaa koulutusta.