A 13 500 nastygramból álló gyűjtemény elősegítheti a háborút a trollok ellen

A Wikipédia vitalapjain januárban megjelent bejegyzések vizualizációja a személyes támadások előfordulását mutatja pirossal.
Nőgyűlölet, rasszizmus, káromkodás – a több mint 13 500 online személyes támadásból álló gyűjtemény mindent tartalmaz.
A nastygramok a Wikipédia vitalapjairól származtak. A gyűjtemény több mint 100 000 jóindulatú bejegyzéssel együtt kiadták az Alphabet és a Wikipédia mögött álló nonprofit szervezet, a Wikimedia Foundation kutatói. Szerintük az adatok fokozni fogják a szoftverek képzésére irányuló erőfeszítéseket, hogy megértsék és felügyeljék az online zaklatást.
Célunk az, hogy megvizsgáljuk, hogyan segíthetünk az embereknek a legvitatottabb és legfontosabb témákról produktív módon megbeszélni az egész interneten – mondja Lucas Dixon, a vállalat vezető kutatója. Lombfűrész , az Alphabet-en belüli csoport, amely technológiát épít olyan ügyek szolgálatába, mint a szólásszabadság és a korrupció elleni küzdelem (lásd: „Ha csak a mesterséges intelligencia megmenthet minket magunktól”).
A Jigsaw és a Wikimedia kutatói egy crowdsourcing szolgáltatást használtak arra, hogy az emberek átfésüljék a Wikipédia vitalapjain elhelyezett több mint 115 000 üzenetet, és ellenőrizzék, nem történt-e személyes támadás. a közösség szabályai határozzák meg . Az együttműködők már felhasználták az adatokat olyan gépi tanulási algoritmusok betanításához, amelyek a személyes támadások észlelésében a tömeges forrásból származó dolgozókkal vetekednek. Amikor végigfuttatták a Wikipédia szerkesztői által készített 63 millió vitabejegyzést tartalmazó teljes gyűjteményt, azt találták, hogy 10-ből csak egy támadás vezetett a moderátorok intézkedéséhez.
A Wikimédia Alapítvány készítette a zaklatás csökkentése a Wikipédia szerkesztői között tavaly elsőbbséget élveztek. A politika hozzáadja a meglévő erőfeszítéseket a Wikipédia-közösség szúrós és bürokratikus légkörének enyhítésére, amelyről kiderült, hogy elriasztja az új hozzászólókat a részvételtől. Mindkét probléma magyarázatot adhat arra, hogy miért csúszik a szerkesztők száma, és miért küzdött azért, hogy a részvételi arányt kiterjessze egy alapvető, nyugati demográfiai csoporton túlra (lásd: A Wikipédia hanyatlása).
A Jigsaw és a Wikimedia Foundation nem az első, amely tanulmányozza az online visszaéléseket, és nem is ők az elsők, akik olyan szoftvert terveznek, amely képes észlelni és küzdeni ellene. A zaklató és nem zaklató bejegyzéseket megjelölő megjegyzések gyűjteménye azonban – amelyekre szükség van a gépi tanulási szoftverek betanításához – kevés volt, mondja Ellery Wulczyn , a Wikimedia Foundation adattudományi kutatója.
Becslései szerint a személyes támadások és megjegyzések gyűjteménye a Wikipédiáról 10-100-szor nagyobb, mint a korábban elérhetők. A gépi tanulási algoritmusoknak nagyszámú címkézett példára van szükségük ahhoz, hogy megtanulják az adatok pontos szűrését.
Még mindig nem világos, hogy a visszaélések észlelésére kiképzett algoritmusok használhatók-e hatékony moderátorként. A szoftver messze nem érti a nyelv minden árnyalatát. Vannak, akik arra késztetnek, hogy sértő nyelvezetüket hangolják, hogy elkerüljék az észlelést, mondja Wulczyn a Wikimédiából. Ha olyan beavatkozásokat építenénk ki, amelyekkel az emberek ellenséges viszonyban vannak, nem tudjuk, mi történne – mondja.
nagy autó vs kis autó