▷ Boffins bleattrar Googles detekteringsalgoritm visar rasförspänning

Stoppa oss om du har hört detta tidigare

BRA, ser du att andra maskininlärningsalgoritmer från Google som innehåller rasisk förspänning; vem kommer att kasta det.

Forskning som gjordes av University of Washington, Carnegie Mellon University och Allen Institute for Artificial Intelligence kom till slutsatsen att Googles verktyg för taligenkänning, som är en produkt från dess Jigsaw-division som används för att upptäcka missbruk på sociala medier, har markerat den slang som används av Svarta amerikaner är mer giftiga än att känna igen vissa fraser som en del av deras språk.

Smarta människor tillämpar perspektivverktyget på ett par databaser som används ofta vid upptäckt av hatprat, där det kommer att tilldela en “toxicitetspoäng” på sociala mediaposter som är markerade som oförskämd och stötande för att anta hur illa en viss tweet är till exempel.

Överraskning, överraskning, det upptäcktes att enheten verkade spottas ut en högre toxicitet poäng för talmönster för svarta amerikaner.

Problemet här verkar fördubblas. För det första finns det en förspänning i databasen som används för att utbilda intelligenta algoritmer som ord och fraser som anses kränkande att taggas som sådana utan att ta hänsyn till vem som sa det och varför.

Till exempel kan användningen av ordet “queer” vara stötande om det används av heterosexuella människor som undantag, men som används av homosexuella kan vara ett positivt begrepp; burk kan äpple till samma N-ord, som är offensivt förkastligt när det används som ett nedsättande uttryck för vita människor men mer en form av slang när det används av svarta människor.

Forskarna försökte sedan verktyg mot sina egna anteckningar för att tweeta och fann samma förspänning som Perspektiv. Först när de lägger till att ge annotatorn lite grundläggande kunskaper om huruvida tweeten var skriven av svarta människor eller använde ett vanligt språk på svart engelska, minskades förspänningsnivån.

Forskningsresultat ska inte ses som verktyg för att märka perspektivverktyg eller annotatorer från databaser som är utbildade som rasister. Istället visar det att extra ansträngning måste göras för att säkerställa att förspänningen inte omedvetet sugs in i systemet och datauppsättningen.

“Vi finner starka bevis på att extra uppmärksamhet måste ägnas åt effekten av förvirrande dialekter för att undvika oönskade rasfördomar vid upptäckten av hatprat,” sade forskarna.

Det kan vara lättare sagt än gjort, eftersom det är komplicerat att upptäcka omedvetna fördomar. Men att ha mer olika datauppsättningar och människor att bedöma dem, såväl som utvecklare med olika bakgrunder kan göra flera sätt att eliminera systemets partiskhet. μ

Boffins bleattrar Googles detekteringsalgoritm visar rasförspänning

Rekommenderad: