A Deep Neural Network megtanulja megítélni a könyveket a borítójuk alapján
Az idióma soha ne ítéljen meg egy könyvet a borítója alapján, és óva int attól, hogy valamit pusztán a megjelenése alapján értékeljünk. Pedig a könyvborítók célja, hogy az olvasók képet kapjanak a tartalomról, hogy kedvet kapjanak egy könyvhöz és elolvassák. A jó könyvborítókat úgy tervezték, hogy elbírálják őket.
És az emberek nagyon jók ebben. Viszonylag egyszerű kiválasztani egy szakácskönyvet, életrajzot vagy útikalauzt, ha ránézünk a borítóra.
És ez felvet egy érdekes kérdést: vajon a gépek megítélhetik-e a könyveket a borítójuk alapján is? Már tudjuk, hogy az arcuk alapján ítélik meg az embereket.

Ma választ kapunk Brian Kenji Iwana és Seiichi Uchida munkájának köszönhetően a japán Kyushu Egyetemen. Ezek a srácok egy mély neurális hálózatot képeztek ki, hogy tanulmányozzák a könyvborítókat, és meghatározzák a könyv kategóriáját, ahonnan származnak.
Bővebben a gépi tanulásról
Az új fotószűrővel a Facebook bejelenti azt a tervét, hogy mesterséges intelligencia támadja meg telefonját
Az eszköz szórakoztató, de egyben küldetésnyilatkozat is a közösségi hálózatok óriásának.
A StarCraft lesz a mesterséges intelligencia következő nagy játszótere
A mesterséges intelligencia kulcsfontosságú fejlődést igényel, hogy olyan videojátékot játsszon, amely tele van tervezéssel, találgatásokkal és blöfföléssel.
A gépek most már felismernek valamit, miután egyszer látták
Az algoritmusoknak általában több ezer példára van szükségük ahhoz, hogy megtanuljanak valamit. A Google DeepMind kutatói megtalálták a megoldást.
A mai mesterséges intelligencia nem igazolja az alapjövedelmet
Még a legegyszerűbb munkákhoz is olyan készségekre van szükség – mint például a kreatív problémamegoldás –, amelyeket a mesterséges intelligencia rendszerek még nem tudnak kompetensen elvégezni.
Az AI nyelvi problémája
A nyelvet valóban értő gépek hihetetlenül hasznosak lennének. De nem tudjuk, hogyan építsük fel őket.
A módszerük egyértelmű. Iwana és Uchida 137 788 egyedi könyvborítót töltött le az Amazon.com oldaláról a könyv műfajával együtt. 20 lehetséges műfaj létezik, de ahol egy könyvet több kategóriába soroltak, a kutatók csak az elsőt használták.
Ezután a pár az adatkészlet 80 százalékát arra használta fel, hogy egy neurális hálózatot betanítson a műfaj felismerésére a borítókép alapján. Neurális hálózatuk négy rétegből áll, amelyek mindegyike legfeljebb 512 neuronból áll, amelyek együtt megtanulják felismerni a borítótervezés és a műfaj közötti összefüggést. A pár az adatkészlet további 10 százalékát használta fel a modell validálására, majd tesztelte a neurális hálózatot az utolsó 10 százalékon, hogy lássa, milyen jól kategorizálja a még soha nem látott lefedettségeket.
Az eredmények érdekes olvasmányt tesznek lehetővé. Az algoritmus az esetek 40 százalékában a megfelelő műfajt sorolta a legjobb 3 választási lehetőség közé, és az esetek több mint 20 százalékában a pontos műfajt találta. Ez lényegesen jobb, mint a véletlen. Ez azt mutatja, hogy a könyvborítótervek osztályozása lehetséges, bár nagyon nehéz feladat, mondják Iwana és Uchida.
Néhány kategória könnyebben felismerhető, mint mások. Például az útikönyveket és a számítógépről és a technológiáról szóló könyveket a neurális hálózat viszonylag könnyen észreveszi, mivel a könyvtervezők következetesen hasonló képeket és dizájnt használnak ezekhez a műfajokhoz.
a hubble még mindig működik
A neurális háló azt is megállapította, hogy a szakácskönyvek könnyen felismerhetők, ha ételképeket használnak, de teljesen kétértelműek, ha más dizájnt, például a szakács képét használták.
Az életrajzok és az emlékiratok szintén problémásak voltak, mivel az algoritmus gyakran a történelmet választotta kategóriaként. Érdekes módon sok ilyen könyv esetében a történelem az Amazonon felsorolt másodlagos műfaj, ami azt sugallja, hogy az algoritmus nem volt teljesen elrontva.
Az algoritmus a gyerekkönyveket is összekeverte a képregényekkel és képregényekkel, valamint az orvosi könyvekkel és a tudományos könyvekkel. Talán ez is érthető, tekintettel a kategóriák közötti hasonlóságokra.
Ennek a munkának van egy hiányossága. Iwana és Uchida nem hasonlította össze neurális hálózatának teljesítményét az emberek azon képességével, hogy a borítójukról felismerjék a könyvműfajokat. Ez egy érdekes kísérlet lenne, és egy olyan online crowdsourcing szolgáltatással, mint például az Amazon Mechanical Turk, viszonylag egyszerű lenne.
Amíg ezt a munkát el nem végzik, nem lehet tudni, hogy a gépek jobban teljesítik-e ezt a feladatot, mint az emberek. Bár bármennyire is jók az emberek ebben a feladatban, minden bizonnyal csak idő kérdése, hogy a gépek mikor teljesítik felül őket.
Mindazonáltal ez egy érdekes munka, amely segíthet a tervezőknek fejleszteni készségeiket a könyvborítók terén. Valószínűbb eredmény azonban az, hogy felhasználható arra, hogy gépeket tanítsanak könyvborítók tervezésére emberi közreműködés nélkül. Ez pedig azt jelenti, hogy a könyvborítók tervezése csak egy újabb munka, amelyet a történelemkönyvekbe kell helyezni.
Ref: arxiv.org/abs/1610.09204 : Egy könyv megítélése a borítója alapján