A Deep Neural Network megtanulja megítélni a könyveket a borítójuk alapján

Az idióma soha ne ítéljen meg egy könyvet a borítója alapján, és óva int attól, hogy valamit pusztán a megjelenése alapján értékeljünk. Pedig a könyvborítók célja, hogy az olvasók képet kapjanak a tartalomról, hogy kedvet kapjanak egy könyvhöz és elolvassák. A jó könyvborítókat úgy tervezték, hogy elbírálják őket.

És az emberek nagyon jók ebben. Viszonylag egyszerű kiválasztani egy szakácskönyvet, életrajzot vagy útikalauzt, ha ránézünk a borítóra.

És ez felvet egy érdekes kérdést: vajon a gépek megítélhetik-e a könyveket a borítójuk alapján is? Már tudjuk, hogy az arcuk alapján ítélik meg az embereket.



Ma választ kapunk Brian Kenji Iwana és Seiichi Uchida munkájának köszönhetően a japán Kyushu Egyetemen. Ezek a srácok egy mély neurális hálózatot képeztek ki, hogy tanulmányozzák a könyvborítókat, és meghatározzák a könyv kategóriáját, ahonnan származnak.

Bővebben a gépi tanulásról

  • Az új fotószűrővel a Facebook bejelenti azt a tervét, hogy mesterséges intelligencia támadja meg telefonját

    Az eszköz szórakoztató, de egyben küldetésnyilatkozat is a közösségi hálózatok óriásának.

  • A StarCraft lesz a mesterséges intelligencia következő nagy játszótere

    A mesterséges intelligencia kulcsfontosságú fejlődést igényel, hogy olyan videojátékot játsszon, amely tele van tervezéssel, találgatásokkal és blöfföléssel.

  • A gépek most már felismernek valamit, miután egyszer látták

    Az algoritmusoknak általában több ezer példára van szükségük ahhoz, hogy megtanuljanak valamit. A Google DeepMind kutatói megtalálták a megoldást.

  • A mai mesterséges intelligencia nem igazolja az alapjövedelmet

    Még a legegyszerűbb munkákhoz is olyan készségekre van szükség – mint például a kreatív problémamegoldás –, amelyeket a mesterséges intelligencia rendszerek még nem tudnak kompetensen elvégezni.

  • Az AI nyelvi problémája

    A nyelvet valóban értő gépek hihetetlenül hasznosak lennének. De nem tudjuk, hogyan építsük fel őket.

A módszerük egyértelmű. Iwana és Uchida 137 788 egyedi könyvborítót töltött le az Amazon.com oldaláról a könyv műfajával együtt. 20 lehetséges műfaj létezik, de ahol egy könyvet több kategóriába soroltak, a kutatók csak az elsőt használták.

Ezután a pár az adatkészlet 80 százalékát arra használta fel, hogy egy neurális hálózatot betanítson a műfaj felismerésére a borítókép alapján. Neurális hálózatuk négy rétegből áll, amelyek mindegyike legfeljebb 512 neuronból áll, amelyek együtt megtanulják felismerni a borítótervezés és a műfaj közötti összefüggést. A pár az adatkészlet további 10 százalékát használta fel a modell validálására, majd tesztelte a neurális hálózatot az utolsó 10 százalékon, hogy lássa, milyen jól kategorizálja a még soha nem látott lefedettségeket.

Az eredmények érdekes olvasmányt tesznek lehetővé. Az algoritmus az esetek 40 százalékában a megfelelő műfajt sorolta a legjobb 3 választási lehetőség közé, és az esetek több mint 20 százalékában a pontos műfajt találta. Ez lényegesen jobb, mint a véletlen. Ez azt mutatja, hogy a könyvborítótervek osztályozása lehetséges, bár nagyon nehéz feladat, mondják Iwana és Uchida.

Néhány kategória könnyebben felismerhető, mint mások. Például az útikönyveket és a számítógépről és a technológiáról szóló könyveket a neurális hálózat viszonylag könnyen észreveszi, mivel a könyvtervezők következetesen hasonló képeket és dizájnt használnak ezekhez a műfajokhoz.

a hubble még mindig működik

A neurális háló azt is megállapította, hogy a szakácskönyvek könnyen felismerhetők, ha ételképeket használnak, de teljesen kétértelműek, ha más dizájnt, például a szakács képét használták.

Az életrajzok és az emlékiratok szintén problémásak voltak, mivel az algoritmus gyakran a történelmet választotta kategóriaként. Érdekes módon sok ilyen könyv esetében a történelem az Amazonon felsorolt ​​másodlagos műfaj, ami azt sugallja, hogy az algoritmus nem volt teljesen elrontva.

Az algoritmus a gyerekkönyveket is összekeverte a képregényekkel és képregényekkel, valamint az orvosi könyvekkel és a tudományos könyvekkel. Talán ez is érthető, tekintettel a kategóriák közötti hasonlóságokra.

Ennek a munkának van egy hiányossága. Iwana és Uchida nem hasonlította össze neurális hálózatának teljesítményét az emberek azon képességével, hogy a borítójukról felismerjék a könyvműfajokat. Ez egy érdekes kísérlet lenne, és egy olyan online crowdsourcing szolgáltatással, mint például az Amazon Mechanical Turk, viszonylag egyszerű lenne.

Amíg ezt a munkát el nem végzik, nem lehet tudni, hogy a gépek jobban teljesítik-e ezt a feladatot, mint az emberek. Bár bármennyire is jók az emberek ebben a feladatban, minden bizonnyal csak idő kérdése, hogy a gépek mikor teljesítik felül őket.

Mindazonáltal ez egy érdekes munka, amely segíthet a tervezőknek fejleszteni készségeiket a könyvborítók terén. Valószínűbb eredmény azonban az, hogy felhasználható arra, hogy gépeket tanítsanak könyvborítók tervezésére emberi közreműködés nélkül. Ez pedig azt jelenti, hogy a könyvborítók tervezése csak egy újabb munka, amelyet a történelemkönyvekbe kell helyezni.

Ref: arxiv.org/abs/1610.09204 : Egy könyv megítélése a borítója alapján

elrejt

Tényleges Technológiák

Kategória

Nincs Kategorizálva

Technológia

Biotechnológia

Technikai Politika

Klímaváltozás

Ember És Technológia

Szilícium-Völgy

Számítástechnika

Mit News Magazin

Mesterséges Intelligencia

Tér

Okos Városok

Blockchain

Feature Story

Alumni Profil

Öregdiák Kapcsolat

Mit News Funkció

1865

Az Én Nézetem

77 Mass Ave

Ismerje Meg A Szerzőt

Profilok A Nagylelkűségben

Az Egyetemen Látható

Öregdiák Levelei

Hírek

Mit News Magazine

Választások 2020

Indexszel

A Kupola Alatt

Tűzoltótömlő

Végtelen Történetek

Pandémiás Technológiai Projekt

Az Elnöktől

Fedősztori

Képgaléria

Ajánlott