A mesterséges intelligencia szoftvere zsonglőrködik a kevesebb adatból való tanulás valószínűségével

A Gamalon által fejlesztett alkalmazás néhány példa megtekintése után felismeri az objektumokat. Egy tanulási program felismeri az egyszerűbb fogalmakat, például a vonalakat és a téglalapokat.
A gépi tanulás rendkívül erőteljessé válik, de rendkívül nagy mennyiségű adatot igényel.
Taníthat például egy mélytanulási algoritmust, hogy felismerjen egy macskát egy macskabarát szakértelemmel, de több tíz- vagy akár százezer macskaféle képpel kell etetnie a macskafélékről, amelyek hatalmas mennyiségű változatot rögzítenek. méretben, formában, textúrában, megvilágításban és tájolásban. Sokkal hatékonyabb lenne, ha egy algoritmus – egy kicsit az emberhez hasonlóan – kevesebb példából kidolgozna egy ötletet arról, mitől lesz egy macska macska.
Egy bostoni székhelyű startup ún Gamalon olyan technológiát fejlesztett ki, amely bizonyos helyzetekben lehetővé teszi a számítógépek számára, hogy ezt megtegyék, és kedden két terméket is kiad a megközelítés alapján.
Ha a mögöttes technika sok más feladatra is alkalmazható, akkor annak nagy hatása lehet. A kevesebb adatból való tanulás képessége révén a robotok nagyon gyorsan felfedezhetik és megérthetik az új környezeteket, vagy lehetővé teheti a számítógépek számára, hogy az adatok megosztása nélkül tájékozódjanak az Ön preferenciáiról.
A Gamalon egy általa Bayes-féle programszintézisnek nevezett technikát használ, hogy kevesebb példából tanulni képes algoritmusokat építsen. A 18. századi matematikusról, Thomas Bayesről elnevezett bayesi valószínűség matematikai keretet ad a világra vonatkozó tapasztalatokon alapuló jóslatok finomításához. Gamalon rendszere valószínűségi programozást használ – vagy olyan kódot, amely a valószínűségekkel, nem pedig konkrét változókkal foglalkozik – egy adott adatkészletet magyarázó prediktív modell felépítéséhez. Néhány példa alapján egy valószínűségi program meg tudja határozni például, hogy nagyon valószínű, hogy a macskáknak van fülük, bajuszuk és farkuk. Amint további példák is szerepelnek, a modell mögötti kódot átírják, és a valószínűségeket módosítják. Ez hatékony módot biztosít a kiemelkedő tudás elsajátítására az adatokból.
A valószínűségi programozási technikák egy ideje léteznek. 2015-ben például az MIT és a NYU egy csapata valószínűségi módszereket használt annak érdekében, hogy a számítógépek megtanulják felismerni az írott karaktereket és tárgyakat, miután csak egy példát láttak (lásd: Ez az AI algoritmus olyan gyorsan tanul meg egyszerű feladatokat, mint mi). De ez a megközelítés többnyire akadémiai kíváncsiság volt.
Nehéz számítási kihívásokat kell leküzdeni, mert a programnak sokféle lehetséges magyarázatot kell figyelembe vennie, mondja Brenden-tó , a NYU kutatója, aki a 2015-ös munkát vezette.
Lake szerint azonban elméletben a megközelítés jelentős potenciállal rendelkezik, mivel automatizálhatja a gépi tanulási modell fejlesztésének szempontjait. Lake szerint a valószínűségi programozás sokkal könnyebbé teszi a gépi tanulást a kutatók és a gyakorlati szakemberek számára. Lehetőség van arra, hogy automatikusan gondoskodjon a bonyolult [programozási] részekről.
Minden bizonnyal jelentős ösztönzők vannak a könnyebben használható és kevésbé adatigényes gépi tanulási megközelítések kidolgozására. A gépi tanulás jelenleg nagy nyers adathalmaz beszerzését, majd gyakran manuális címkézését foglalja magában. A tanulás ezután nagy adatközpontokban történik, számos számítógépes processzor segítségével, amelyek párhuzamosan kavarnak órákon vagy napokon keresztül. Csak néhány igazán nagy cég engedheti meg magának ezt, mondja Ben Vigoda, a Gamalon társalapítója és vezérigazgatója.
Elméletileg Gamalon megközelítése nagyban megkönnyítheti valakinek a gépi tanulási modell felépítését és finomítását is. A mélytanulási algoritmus tökéletesítése nagy matematikai és gépi tanulási szakértelmet igényel. Ezeknek a rendszereknek a felállítása fekete művészet, mondja Vigoda. Gamalon megközelítésével a programozó jelentős példákkal betáplálhat egy modellt.
Vigoda megmutatta MIT Technology Review demó a technikát használó rajzalkalmazással. Hasonló a Google által tavaly kiadotthoz, amely mély tanulást használ annak az objektumnak a felismerésére, amelyet egy személy felvázolni próbál (lásd: Szeretne megérteni az AI-t? Próbáljon felvázolni egy kacsát egy neurális hálózathoz ). De míg a Google alkalmazásának olyan vázlatot kell látnia, amely megegyezik a korábban látottakkal, addig a Gamalon verziója egy valószínűségi programot használ az objektum legfontosabb jellemzőinek felismerésére. Például egy program megérti, hogy egy négyzet tetején ülő háromszög valószínűleg egy ház. Ez azt jelenti, hogy még ha a vázlat nagyon eltér attól, amit korábban látott, akkor is helyesen fog kitalálni, feltéve, hogy rendelkezik ezekkel a jellemzőkkel.
A technikának jelentős rövid távú kereskedelmi alkalmazásai is lehetnek. A cég első termékei Bayes-féle programszintézist használnak a fogalmak szövegben történő felismerésére.
Az egyik termék, a Gamalon Structure a szokásosnál hatékonyabban képes kivonni a fogalmakat a nyers szövegből. Például figyelembe veheti a televízió gyártójának leírását, és meghatározhatja, hogy melyik terméket írja le, a márkát, a termék nevét, a felbontást, a méretet és egyéb jellemzőket. Egy másik termék, a Gamalon Match, a termékek és az árak kategorizálására szolgál az üzlet készletében. Minden esetben, még akkor is, ha egy termékhez vagy szolgáltatáshoz különböző betűszavakat vagy rövidítéseket használnak, a rendszer gyorsan betanítható ezek felismerésére.
Vigoda úgy véli, hogy a tanulási képességnek más gyakorlati előnyei is lesznek. A számítógép anélkül is megismerheti a felhasználó érdeklődési körét, hogy nem igényelne praktikus mennyiségű adatot vagy órákat. Lehet, hogy a személyes adatokat sem kell megosztani a nagyvállalatokkal, ha a gépi tanulás hatékonyan elvégezhető a felhasználó okostelefonján vagy laptopján. És egy robot vagy egy önvezető autó megtanulhat egy új akadályt anélkül, hogy több százezer példát kellene látnia.