Spoken Document Retrieval

Forschung - Spoken Document Retrieval

Spoken Document Retrieval

W. Macherey

Spoken Document Retrieval ist eine Spezialisierung der allgemeinen Aufgabe, Dokumente aus einer Datenbasis wiederaufzufinden (Information Retrieval). Anstelle geschriebener Texte stehen hier Tondokumente wie etwa Aufzeichnungen von Fernseh- oder Radionachrichten.

Beim Information Retrieval sind im Gegensatz zu einer Datenbank keine Strukturen in den Daten vorgegeben, in die sich die einzelnen Dokumente einpassen müßten. Stattdessen werden aus den Daten selbst Indexfeatures gewonnen um die Dokumente zu beschreiben. Beim Textretrieval etwa verwendet man die im Text enthaltenen Wörter bzw. deren Stämme als Indexterme der Dokumente. Den einzelnen Indextermen werden Gewichte zugeordnet. Stellt der Benutzer nun eine Anfrage, so kann das Retrievalsystem mit einer geeigneten Metrik unter Verwendung der Indexterme die Ähnlichkeit zwischen der Anfrage und den einzelnen Dokumenten berechnen. Die Antwort des Systems besteht dann aus den ähnlichsten Dokumenten.

Beim Spoken Document Retrieval müssen zunächst die Tondokumente in schriftliche Form gebracht werden. Das kann auf Wortebene oder auch auf Phonemebene geschehen. Die Tondokumente werden dazu mit Hilfe eines Spracherkennungssystems transskribiert. Die automatisch erstellten Transskripte sind jedoch nicht fehlerfrei.

Das Projekt untersucht die Auswirkungen der Fehler auf die Qualität des Retrievalergebnisses und erforscht mögliche Abhilfen. Auf Wortebene ist etwa der Einsatz von N-Bestenlisten für jeden Satz denkbar, anstatt nur die jeweils beste Wortkette zu verwenden. Auf Phonemebene kann man für ähnlichklingende Wörter Phonemverwechslungsmatrizen aufstellen, um Alternativen zum erkannten Wort zuzulassen.

Last modified: Thu Nov 4 17:32:10 MET