Software durchforscht Radio- und TV-Archive

Wissenschaftler der Hochschule Duisburg haben eine Software entwickelt, die gesprochene Nachrichten auswertet und nach Themen sortiert.

In Pocket speichern vorlesen Druckansicht 18 Kommentare lesen
Lesezeit: 3 Min.
Von
  • Andreas Grote

Am Fachgebiet Technische Informatik an der Hochschule Duisburg haben Wissenschaftler um Prof. Gerhard eine neue Software zur automatischen Themenerkennung in Multimedia-Daten entwickelt. Sie soll helfen, aus dem übergroßen und unüberschaubaren Informationsangebot von Internet, Radio und Fernsehen spezielle Themen herauszufiltern.

Das "Alert System for Selective Dissemination of Multimedia Information", kurz Alert-System genannt, wandelt unter anderem Beiträge von Nachrichtensprechern, Reportern oder Moderatoren per automatischer Spracherkennung in Text um. Darin erkennt Alert zuvor einprogrammierte Themen und Schlüsselwörter und speichert diese in einer Liste, die anschließend mit den Themen und Schlüsselwörtern verglichen wird, die der Nutzer zuvor definiert hat. Entsprechende Informationen werden dann bereitgestellt. Um das Ergebnis möglichst frei von unnötigen oder unerwünschten Informationen zu halten, erkennt die Software auch Themengrenzen und kann unterscheiden zwischen den verschiedenen Teilen einer Sendung wie Interview, Moderation oder Reportage. Gleichzeitig ist sie in der Lage, mehrere Medien zur selben Zeit und rund um die Uhr auszuwerten.

Um einen möglichst hohen Anteil der gesprochenen Sprache korrekt zu erkennen, haben die Duisburger Informatiker ihre Software trainiert, indem sie aus Zeitungstexten, Audio- und Videomaterial rund 350 Millionen Wörter verarbeitet haben. Probleme bereitet dem Programm allerdings die in vielen Sendungen und auch Reportagen beliebte Musikuntermalung, aber auch starke Hintergrundgeräusche beispielsweise bei Außenreportagen führen zu Ungenauigkeiten bei der Textumwandlung und der Erkennung.

Aus diesem Grund haben sich die Forscher nicht auf die rein textliche, sondern inhaltliche Erkennung konzentriert. Würde man beispielsweise Radio- und Fernsehbeiträge nach dem Schlüsselbegriff ölpreis durchsuchen, so würde Alert nicht nur solche Beiträge herausfinden, die das Schlüsselwort enthalten, sondern auch jene, die sich mit dem Thema beschäftigen, auch wenn das Wort ölpreis selbst nicht erwähnt wird. Alert liest hierzu quasi zwischen den Zeilen und analysiert alle Wörter im gesamten Beitrag, bevor dieser einem Thema zugeordnet wird.

Alert soll nach Vorstellungen seiner Entwickler später einmal auf jedem handelsüblichen PC laufen und könnte dann sowohl der beruflichen wie privaten Recherche dienen. Besonders für Firmen, die ihre Medienpräsenz oder die der Konkurrenz beobachten wollen oder zur aufwendigen Recherche in großen Film- und Pressearchiven, könnte Alert viel Zeit und Geld sparen. Da die Informatiker zudem mit Partnern aus Frankreich und Portugal zusammen arbeiten, sind beim derzeitigen Entwicklungsstand Suchanfragen in drei Sprachen möglich.

Das von der EU mit 1,5 Millionen Mark geförderte Projekt läuft noch bis zum Jahr 2002, doch die Wissenschaftler haben sich bereits neue Ziele gesteckt. So wollen sie sich künftig nicht nur auf die inhaltliche, sondern auch auf die optische Suche konzentrieren. So könnte Alert dann beispielsweise bei einer Suchanfrage auch bestimmte Personen in Filmen oder Bildmaterial erkennen. (Andreas Grote) / (em)