/Deep-Learning-Algorithmus erkennt Sarkasmus in sozialen Medien

Deep-Learning-Algorithmus erkennt Sarkasmus in sozialen Medien

Deep-Learning-Algorithmus erkennt Sarkasmus in sozialen Medien


Sascha Mattke

(Bild: Frank Behrens / Flickr / cc-by-sa-2.0)

Selbst Menschen tun sich manchmal schwer dabei, zu erkennen, ob eine Aussage sarkastisch gemeint ist. MIT-Forscher haben jetzt einen Algorithmus entwickelt, der Menschen bei dieser Aufgabe übertrifft.

Forscher am MIT haben einen Algorithmus entwickelt, der zielsicher erkennen kann, ob eine Nachricht auf Twitter sarkastisch gemeint ist. In Tests schnitt DeepMoji nach Angaben seiner Entwickler besser ab als verschiedene Referenzsysteme und auch als Menschen: Er kam auf eine Trefferquote von 82 Prozent, während menschliche Freiwillige nur 76 Prozent erreichten. Das berichtet Technology Review online in “Computer erkennt Sarkasmus“.

Lesen Sie dazu auch:

Die MIT-Forscher hatten zunächst vor, ein System zu entwickeln, dass rassistische Beiträge auf Twitter erkennt. Bald allerdings wurde ihnen klar, dass sich die Aussagen vieler Botschaften ohne ein gewisses Sarkasmus-Verständnis nicht richtig einordnen lassen. Ihr Algorithmus basiert auf Deep Learning, einer verbreiteten Technik, bei der die Simulation eines großen neuronalen Netzes mit Hilfe großer Datenmengen darauf trainiert wird, subtile Muster zu erkennen. Hilfreich bei dem MIT-System war die Tatsache, dass viele Tweets bereits eine Art Kennzeichnungssystem für Emotionen nutzen: Emojis. Die Forscher setzten sie ein, um die allgemeinen Emotionen in Tweets zu identifizieren, was im nächsten Schritt auch dabei half, Sarkasmus zu verstehen.

Für das Training des Algorithmus sammelten die Forscher 55 Milliarden Twitter-Nachrichten und wählten davon 1,2 Milliarden aus, in denen eine Kombination aus 64 beliebten Emojis zu finden war. Zunächst ließen sie DeepMoji dann lernen, welches Emoji auf eine bestimmte Nachricht folgen würde, abhängig davon, ob sie fröhlich, traurig, humorvoll usw. war. Sarkasmus erlernte das System dann mit Hilfe einer bestehenden Datensammlung mit gekennzeichneten Beispielen. Der Algorithmus soll zur freien Verwendung veröffentlicht werden.

Mehr dazu bei Technology Review online:

(sma)