Schaden, Stefan:

Regelbasierte Modellierung fremdsprachlich akzentbehafteter Aussprachevarianten : Grundlagen, Entwurf und Implementierung eines Regelsystems für sprachtechnologische Anwendungen

Duisburg, Essen (2006), 229 Bl.
Dissertation / Fach: Allgemeines, Sonstiges
Fakultät für Geisteswissenschaften » Institut für Kommunikationswissenschaft
Eschbach, Achim (Doktorvater, Betreuerin)
Jekosch, Ute (GutachterIn)
Dissertation
Abstract:
In der maschinellen Verarbeitung menschlicher Sprache (z.B. automatische Spracherkennung oder Sprachsynthese) werfen ausgeprägte Abweichungen von der Sprachnorm stets besondere Probleme auf. Formen, die außergewöhnlich stark vom durchschnittlichen Sprechverhalten abweichen, gelten vielfach als nicht systemadäquat und führen zu deutlichen Leistungseinbußen sprachtechnologischer Systeme. Im Bereich der automatischen Spracherkennung ist dies z.B. dann der Fall, wenn als potentielle Nutzer eines Systems, welches für die kanonische Aussprachenorm einer Sprache optimiert wurde, auch Nicht-Muttersprachler vorgesehen sind, Sprecher also, die einen fremdsprachlich gefärbten Akzent aufweisen. Hier ist die phonetische Diskrepanz zur Normlautung z.T. so erheblich, daß die Performanz des Erkenners oftmals stark degradiert. Die Arbeit untersucht Abweichungen von der lautsprachlichen Norm, wie sie in fremdsprachlich gefärbten Aussprachevarianten auftreten. Ziel ist es, lautliche Invarianzen in fremdsprachlichen Akzenten zu ermitteln, diese zu systematisieren und schließlich mittels eines regelbasierten Ansatzes zu modellieren, welcher in sprachverarbeitenden Systemen zum praktischen Einsatz kommen kann. Die Studie liefert somit einen neuartigen Beitrag zur multilingualen Ausrichtung sprachverarbeitender Systeme. Zu diesem Zweck werden charakteristische phonetische Realisierungsvarianten von Nicht-Muttersprachlern verschiedener Herkunft auf der Basis empirischer Sprachdaten ermittelt, klassifiziert und schließlich auf Symbolebene (d.h. auf der Ebene phonetischer Transkriptionen) mittels Regeln automatisch generiert. Die Studie behandelt dabei exemplarisch eine Reihe europäischer Sprachen, die in verschiedenen Kombinationen als Muttersprache des Sprechers wie auch als Zielsprache in die Untersuchung einbezogen werden, mit dem Ziel, für jede Kombination aus Muttersprache (L1) und Zielsprache (L2) je einen spezifischen Regelsatz zur Modellierung charakteristischer Aussprachefehler bzw. -varianten zu erstellen. Ausgehend von einer Synopsis der aktuellen Forschungsstandes in Sprachwissenschaft und Sprachtechnologie wird ein Modell einer regelhaften Beschreibung von Aussprachefehlern entwickelt und programmtechnisch umgesetzt. Dieses Modell bzw. seine technische Implementierung wird abschließend mittels eines computerlinguistischen Verfahrens, welches ebenfalls im Rahmen der Arbeit entwickelt wird, einer quantitativen Evaluierung unterzogen. Auf dieser Grundlage werden abschließend Leistung und Grenzen des Verfahrens sowie das Potential seiner künftigen Weiterentwicklung diskutiert.