Bewertung historischer und regionaler Schreibvarianten mit Hilfe von Abstandsmaßen

Dateibereich 17252

1,39 MB in einer Datei, zuletzt geändert am 19.12.2014

Dateiliste / Details

DateiDateien geändert amGröße
BewertungSchreibvarianten.pdf19.12.2014 09:50:001,39 MB
In dieser Diplomarbeit werden vierzehn verschiedene Abstandsmaße evaluiert. Maßstab ist dabei ihre Anwendbarkeit im Kontext historischer Schreibvarianten. Anschließend werden die erfolgreichsten Verfahren zu der flexiblen Abstandsmetrik FlexMetric weiterentwickelt bzw. vereint. Ausgangspunkt der Untersuchungen war die sehr verbreitete Levenshtein-Distanz. Obwohl das Levenshtein-Maß, das auf der Anzahl der Bearbeitungsoperation von Zeichenketten beruht, für sein Alter und seine Einfachheit erstaunlich gute Ergebnisse erzielt, sind spezielle Verfahren erwartungsgemäß effizienter. Die besten Evaluationsresultate erzielt hierbei der von Justin Zobel und Philip Dart entwickelte Editex-Algorithmus. Er vereint die Stärken von auf Bearbeitungsoperationen basierenden Verfahren (z.B. Levenshtein) mit phonetischen Gruppierungsverfahren (z.B. Soundex). Ausgehend davon wird der flexible Container FlexMetric für ein Abstandsmaß entwickelt, welches zusätzlich um Trainierbarkeit erweitert wurde. Mittels der stochastischen String Edit-Distance von Ristad und Yianilos erbringt die FlexMetric abermals eine deutliche Steigerung der Retrievalergebnisse. Eine Zusatzbetrachtung führt in eines von vielen weiterführenden Problemen ein, wie verschiedene Komposita oder ihre Teile mit den neuen Abstandsmaßen verglichen werden können.
Lesezeichen:
Permalink | Teilen/Speichern
Dokumententyp:
Wissenschaftliche Abschlussarbeiten » Diplomarbeit, Examensarbeit, Magisterarbeit
Fakultät / Institut:
Fakultät für Ingenieurwissenschaften » Informatik und Angewandte Kognitionswissenschaft » Informatik » Computergraphik und Wissenschaftliches Rechnen
Dewey Dezimal-Klassifikation:
000 Informatik, Informationswissenschaft, allgemeine Werke » 000 Informatik, Wissen, Systeme
Stichwörter:
String Distance Metrics, Spelling Variants
Beitragende:
Prof. Dr. Luther, Wolfram [Gutachter(in), Rezensent(in)]
Prof. Dr.-Ing. Fuhr, Norbert [Gutachter(in), Rezensent(in)]
Sprache:
Deutsch
Kollektion / Status:
E-Publikationen / Dokument veröffentlicht
Dateien geändert am:
19.12.2014
Medientyp:
Text