"Med AI kommer vi att identifiera hat och hot i sociala medier snabbare"

3 juni 2019

Idag har hat och hot i digitala medier blivit en del av vår vardag. Men mängden kanaler och lättheten att publicera gör det svårt bevaka för de som ansvarar för kanalerna eller för polisen. I ett forskningsuppdrag ska därför Nazar Akrami, lektor vid institutionen för psykologi, och hans forskargrupp ta fram ett automatiskt verktyg för att snabbt identifiera hat och hot i digitala miljöer.

Ni har fått ett forskningsuppdrag från Totalförsvarets forskningsinstitut, vad ska ni göra?
– Vi ska utveckla verktyg som kan hjälpa till exempel polisen eller medieföretag att snabbt hitta hat och hot i digitala miljöer, det kan vara i bloggar, chattar eller liknande digitala medier. Det är en del av ett regeringsuppdrag om våldsbejakande extremism i digitala miljöer.

Nazar Akrami, lektor vid institutionen för psykologi.
Foto: Mark Harris

Finns inte system för att automatiskt identifiera hat och hot?
– Jovisst, idag har vi digitala system som hittar ungefär 5-10 procent, de är alltså inte så bra. Men genom att utveckla system som kan lära sig själv att känna igen hat och hot hoppas vi öka träffsäkerheten markant.

Hur kan systemet lära sig själv?
– Det är system som bygger på artificiell intelligens där vi matar in språkregler. Men för att lära sig ett språk behöver systemet också lära sig själv genom att studera stora textmängder. Vi har till exempel gett den hela svenska Wikipedia för att den ska lära sig svenska språket utöver de språkregler vi gett den. Systemet letar mönster och likheter i alla möjliga avseenden, det kan vara ordföljd, meningslängd, allt tänkbart. Sammanlagt blir de flera tusen olika variabler.

Och hur kommer systemet känna igen hat och hot?
– Förutom att lära sig svenska språket ger vi också systemet texter med hat och hot som den får gå igenom för att hitta mönster och likheter i den typen av texter och hur de skiljer sig från andra texter. De system vi har idag bygger på ett fåtal variabler för att identifiera hat och hot men genom att använda artificiellt intelligens som själv kan analysera texterna och se skillnaderna hoppas vi öka träffsäkerheten markant.

Varifrån kommer de texterna?
– Vi har flera olika sätt. Ett sätt är att vi tar texter från olika bloggar och manuellt bedömer mängden hat i texten på en femgradig skala. Vi har också samlat in hattexter från allmänheten via webbsidan Hatomaten. Där fick vi in 50 000 exempel som vi också går igenom manuellt och graderar.

Vad är nästa steg i projektet?
– För att öka träffsäkerheten behöver vi tillgång till mer texter med hat och hot och vi arbetar för närvarande på att börja samarbeta med medieföretag för att få tillgång till den typen av material. Då hoppas vi öka träffsäkerheten till 10-20 procent. Nästa steg för att öka träffsäkerheten blir att låta systemet själv leta efter texter med hat och hot på nätet och sedan manuellt gå  in och verifiera i efterhand.