A gépek most már felismernek valamit, miután egyszer látták

Legtöbben egyszer-kétszer látva is felismerünk egy tárgyat. De a számítógépes látást és hangfelismerést biztosító algoritmusoknak több ezer példára van szükségük ahhoz, hogy minden új képet vagy szót megismerjenek.

A Google DeepMind kutatói most már megkerülhetik ezt. Ők csinált néhány ügyes finomítást egy mélytanulási algoritmushoz, amely lehetővé teszi, hogy egyetlen példából felismerje a képeken lévő objektumokat és más dolgokat – ez az úgynevezett „egyszeri tanulás”. A csapat bemutatta a trükköt a címkézett képek nagy adatbázisán, valamint a kézíráson és a nyelven.

A legjobb algoritmusok megbízhatóan felismerik a dolgokat, de adatigényük időigényessé és költségessé teszi az elkészítést. Például egy autók közúti észlelésére kiképzett algoritmusnak sok ezer példát kell feldolgoznia ahhoz, hogy megbízhatóan működjön egy vezető nélküli autóban. Ennyi adat összegyűjtése gyakran nem praktikus – például egy olyan robot, amelynek egy ismeretlen otthonban kell navigálnia, nem tud órákat tölteni tanulással.



Oriol Vinyals , az Alphabet mesterséges intelligenciával foglalkozó angliai székhelyű leányvállalata, a Google DeepMind kutatója, memóriakomponenst adott a mélytanulási rendszerhez – egy olyan nagy neurális hálózathoz, amely a dolgok érzékenységének beállításával képes felismerni. Az egymáshoz kapcsolódó összetevők sok rétege nagyjából analóg az agy neuronjaival. Az ilyen rendszereknek sok képet kell látniuk a virtuális neuronok közötti kapcsolatok finomhangolásához.

A csapat a felcímkézett fényképek adatbázisán mutatta be a rendszer képességeit ImageNet . A szoftvernek még több száz képkategóriát kell elemeznie, de ezt követően már egyetlen képből megtanulhat új tárgyakat – mondjuk egy kutyát – felismerni. Hatékonyan megtanulja felismerni a képek azon jellemzőit, amelyek egyedivé teszik azokat. Az algoritmus egyetlen példa megtekintése után is képes volt felismerni a kutyákról készült képeket egy hagyományos, adatéhes rendszeréhez közeli pontossággal.

Vinyals szerint a munka különösen hasznos lehet, ha gyorsan felismeri egy új szó jelentését. Ez fontos lehet a Google számára, mondja Vinyals, mivel lehetővé teheti a rendszer számára, hogy gyorsan megtanulja egy új keresési kifejezés jelentését.

Mások egyszeri tanulási rendszereket fejlesztettek ki, de ezek általában nem kompatibilisek a mélytanulási rendszerekkel. Egy tavalyi tudományos projekt valószínűségi programozási technikákat használt, hogy lehetővé tegye ezt a fajta nagyon hatékony tanulást (lásd: „Ez az algoritmus olyan gyorsan tanul meg feladatokat, mint mi”).

De a mély tanulási rendszerek egyre alkalmasabbak, különösen a memóriamechanizmusok hozzáadásával. A Google DeepMind egy másik csoportja a közelmúltban kifejlesztett egy rugalmas típusú memóriával rendelkező hálózatot, amely egyszerű gondolkodási feladatok elvégzésére képes – például több, sokkal egyszerűbb hálózati diagram elemzése után megtanulni, hogyan kell navigálni egy metrórendszerben (lásd: „Mi történik, ha adunk” Számítógép munkamemória? ').

'Úgy gondolom, hogy ez egy nagyon érdekes megközelítés, amely újszerű módszert kínál az egyszeri tanuláshoz ilyen nagyszabású adathalmazokon' - mondja Sang Wan Lee , aki a dél-koreai Daejeonban található Koreai Fejlett Tudományos és Technológiai Intézet Agyi és Gépi Intelligencia Laboratóriumát vezeti. 'Ez egy technikai hozzájárulás az AI közösséghez, amit a számítógépes látás kutatói teljes mértékben értékelhetnek.'

Mások szkeptikusabbak a hasznosságával kapcsolatban, tekintettel arra, hogy még mindig mennyire különbözik az emberi tanulástól. Egyrészt, mondja Sam Gershman , a Harvard Agytudományi Tanszékének adjunktusa, az emberek általában úgy tanulnak, hogy megértik a képet alkotó összetevőket, amihez szükség lehet némi valós vagy józan ismeretekre. Például: 'Egy Segway nagyon különbözhet egy kerékpártól vagy motorkerékpártól, de összeállítható ugyanazokból az alkatrészekből.'

Gershman és Wan Lee szerint is eltelik még egy kis idő, mire a gépek megfelelnek az emberi tanulásnak. 'Még mindig távol állunk attól, hogy felfedjük az emberek egyszeri tanulás titkát' - mondja Wan Lee -, de ez a javaslat egyértelműen új kihívásokat vet fel, amelyek további tanulmányozást érdemelnek.

elrejt

Tényleges Technológiák

Kategória

Nincs Kategorizálva

Technológia

Biotechnológia

Technikai Politika

Klímaváltozás

Ember És Technológia

Szilícium-Völgy

Számítástechnika

Mit News Magazin

Mesterséges Intelligencia

Tér

Okos Városok

Blockchain

Feature Story

Alumni Profil

Öregdiák Kapcsolat

Mit News Funkció

1865

Az Én Nézetem

77 Mass Ave

Ismerje Meg A Szerzőt

Profilok A Nagylelkűségben

Az Egyetemen Látható

Öregdiák Levelei

Hírek

Mit News Magazine

Választások 2020

Indexszel

A Kupola Alatt

Tűzoltótömlő

Végtelen Történetek

Pandémiás Technológiai Projekt

Az Elnöktől

Fedősztori

Képgaléria

Ajánlott