Gravierende Abweichungen im Dataset von Google’s Emotions erkannt

Bei Surgehq.ai berichtet Edwin Chen über eine Stichprobe von fehlerhaft klassifizierten Emotionsäußerungen. Dazu wurde das Dataset von Google’s Emotions mit der Klassifizierung von Personen verglichen. Das Ergebnis zeigt, dass etwa ein Drittel der schriftlichen Äußerungen durch Google’s Emotions falsch kategorisiert wurde.

Fernbeziehung mit Smartphones und Kaffeetasse

[…] A whopping 30% of the dataset is severely mislabeled! (We tried training a model on the dataset ourselves, but noticed deep quality issues. So we took 1000 random comments, asked Surgers whether the original emotion was reasonably accurate, and found strong errors in 308 of them.) How are you supposed to train and evaluate machine learning models when your data is so wrong? […]

Weitere Aspekte im Artikel:

  • Google’s Flawed Data Labeling Methodology
  • The Importance of High-Quality Data

Zum Artikel bei Surgehq.ai 30% of Google’s Emotions Dataset is Mislabeled


KI und Emotionen Roboter Laufbursche bedient Hotelgäste

Bildquellen

sds29
  • sds29
  • S Dahms mag Wörter und unterstützt seit 2021 das Testteam der Speech & Phone GmbH und das Redaktionsteam.

One Pingback

Comments are closed.

-+=