Miért fontos a póker a mesterséges intelligencia számára?

Ahogy a nagyszerű Kenny Rogers mondta egyszer, egy jó szerencsejátékosnak tudnia kell, mikor kell megfognia, és tudnia kell, mikor kell bedobnia. A héten a pittsburghi Rivers kaszinóban a Libratus nevű számítógépes program végre bebizonyíthatja, hogy a számítógépek minden emberi kártyajátékosnál jobban képesek erre.

A Libratus több ezer heads-up vagy kétjátékos, no-limit Texas hold’em játékot játszik több profi pókerjátékos ellen. Most, valamivel több, mint a 20 napos verseny felénél, a Libratus közel 800 000 dollárral van előnyben emberi ellenfeleivel szemben. Tehát a győzelem, bár korántsem garantált, valószínűleg benne van a lapokban.



A Libratus győzelme óriási eredmény lenne a mesterséges intelligencia terén. A póker okoskodást és intelligenciát igényel, amelyet nehéznek bizonyult a gépek utánozni. Alapvetően különbözik a dámától, a sakktól vagy a Go-tól, mivel az ellenfél keze rejtve marad a játék során. A tökéletlen információs játékokban rendkívül bonyolult az ideális stratégia kitalálása, figyelembe véve az ellenfél minden lehetséges megközelítését. A no-limit Texas hold’em pedig különösen nagy kihívást jelent, mert az ellenfél lényegében bármilyen összeget fogadhat.

A póker az egyik legnehezebben feltörhető játék az AI számára, mondja Andrew Ng , a Baidu vezető tudósa. Nincs egyetlen optimális lépés, ehelyett egy MI-játékosnak véletlenszerű sorrendbe kell állítania az akcióit, hogy elbizonytalanítsa az ellenfelet, amikor blöfföl.

A Libratust létrehozta Tuomas Sandholm , a CMU számítástechnikai tanszékének professzora és végzős hallgatója Noam Brown . Sandholm, a játékelmélet és a mesterséges intelligencia szakértője, aki Finnországból vándorolt ​​ki doktori tanulmányaiért, azt mondja, elképesztő, hogy az emberek ilyen sokáig képesek felülmúlni a számítógépeket. Egyszerűen feldob a fejemben, milyen jók ezek a legjobb profik” – mondja. „Az AI által leküzdött játékok közül a [póker] az egyetlen, ahol az AI nem ért el emberfeletti teljesítményt.

A mesterséges intelligencia kutatói a játékelméletet vagy a stratégiai döntéshozatal matematikáját használják annak érdekében, hogy megtalálják a legjobb stratégiát különböző bizonytalanságok mellett, az úgynevezett egyensúlyt. Mivel a lehetőségek hatalmasak, ez általában valamilyen közelítést igényel.

Az, hogy egy lépés jó-e vagy sem, olyan dolgoktól függ, amelyeket nem lehet megfigyelni, mondja Vincent Conitzer , a Duke Egyetem professzora, aki mesterséges intelligenciát és játékelméletet tanít. Ez azt is eredményezi, hogy kiszámíthatatlannak kell lenni. Ha soha nem blöffölsz, akkor nem vagy jó játékos. Ha mindig blöffölsz, akkor nem vagy jó játékos. A játékelmélet megmondja, hogyan kell véletlenszerűvé tenni a játékot úgy, hogy az bizonyos értelemben optimális legyen.

Tavaly Sandholm vezette egy korábbi pókerprogram, a Claudico fejlesztését, amelyet több profi pókerjátékos elleni meccsen is alaposan megvertek. Elmondja, hogy a Libratus számos új fejlesztést alkalmaz egy ilyen magas szintű játék eléréséhez. Ez magában foglal egy új egyensúlyi közelítési technikát, mondja Sandholm, valamint számos új módszert a lehetséges kimenetelek elemzésére, amikor a játék későbbi szakaszaiban felfedik a kártyákat. Ez a játékvégi elemzés számítási szempontból igen nagy kihívást jelent, és minden játék során a Pittsburgh Supercomputing Centerben, a CMU és a Pittsburghi Egyetem által üzemeltetett létesítményben elvégzik.

A gépi tanulás és a mesterséges intelligencia fejlődése során számos emberfeletti játékprogram jelent meg az utóbbi időben. Tavaly az Alphabet leányvállalata, a DeepMind kutatói olyan programot fejlesztettek ki, amely képes legyőzni a világ egyik legjobb Go-játékosát. Ez az eredmény azért volt annyira látványos, mert a Go rendkívül összetett, és mert nehéz mérni a játékon belüli előrehaladást (lásd a Google AI Masters Go egy évtizeddel korábban, mint várták).

Néhány különböző kutatócsoport a póker elleni küzdelemre összpontosít. Egy másik akadémiai csapat a kanadai Albertai Egyetemről, valamint a cseh Károlyi Egyetemről és a Cseh Műszaki Egyetemről nemrégiben kidolgozott egy programot, az ún. DeepStack , amely már több profi játékost is legyőzött a heads-up no limit Texas hold'emben (lásd: Poker Is the Latest Game to Fold Against AI). Sandholm szerint azonban a Libratus elleni meccsen résztvevő játékosok sokkal erősebbek, és sokkal több leosztást játszanak a gép ellen, ami nagyobb statisztikai jelentőséggel bír az eredmény szempontjából.

A 2016-os választás napjának előrejelzései

Az intelligensebb pókerbot felépítéséhez használt technikáknak számos valós alkalmazásuk lehet. A játékelméletet már alkalmazták a zavaró támadásokkal és a kiberbiztonsággal, a taxiszolgáltatások automatizált útmutatásával és a robottervezéssel kapcsolatos kutatásokban. Sam Ganzfried , aki részt vett Claudico fejlesztésében, jelenleg pedig a Florida Nemzetközi Egyetem adjunktusa Miamiban.

Azonban még ha a Libratus is diadalmaskodik ezen a héten, ez nem jelenti azt, hogy az emberek már nem érdemlik meg a helyet a kártyaasztalnál. A no-limit Texas hold’em többjátékos változatát nem lehet elsajátítani a Libratus által alkalmazott technikákkal.

elrejt

Tényleges Technológiák

Kategória

Nincs Kategorizálva

Technológia

Biotechnológia

Technikai Politika

Klímaváltozás

Ember És Technológia

Szilícium-Völgy

Számítástechnika

Mit News Magazin

Mesterséges Intelligencia

Tér

Okos Városok

Blockchain

Feature Story

Alumni Profil

Öregdiák Kapcsolat

Mit News Funkció

1865

Az Én Nézetem

77 Mass Ave

Ismerje Meg A Szerzőt

Profilok A Nagylelkűségben

Az Egyetemen Látható

Öregdiák Levelei

Hírek

Mit News Magazine

Választások 2020

Indexszel

A Kupola Alatt

Tűzoltótömlő

Végtelen Történetek

Pandémiás Technológiai Projekt

Az Elnöktől

Fedősztori

Képgaléria

Ajánlott