Format:
Online-Ressource (PDF-Datei: 33 S., circa 0,5 MB)
Series Statement:
DARIAH-DE working papers 22
Content:
Die korpusorientierte Erfassung kolonialzeitlicher Wörterbücher und kulturwissenschaftlichen Forschung amerindischer Sprachen geht mit besonderen Problemstellungen einher. Die Textquellen sind multilingual und unstandardisiert verschriftet, die Lexikoneinträge morphologisch komplex und Bedeutungskorrelationen oft uneinheitlich. Die Überführung solcher Texte in maschinenlesbare Korpora setzt die orthographische Vereinheitlichung, morphologische Analyse und lexikalische Bedeutungszuordnung der Wortformen voraus, die sich als Analyseschritte nicht systematisch trennen lassen. Am Beispiel von kolonialen Wörterbüchern (Lexikographien) der Mayasprache Kʿichʿe wurde an der Abteilung für Altamerikanistik der Rheinischen Friedrich-Wilhelms-Universität Bonn der Prototyp eines Annotationswerkzeugs entwickelt, das den Prozess von Transkription, Glossierung und Lemmatisierung im Rahmen eines halbautomatisierten Auszeichnungsverfahrens unterstützt. Ausgehend von diesem Prototyp soll in der XML-basierten Forschungsumgebung TextGrid ein digitales Werkzeug zur einheitlichen Erfassung kolonialer Lexikographien entstehen, die für die Auszeichnung vergleichbarer Wörterbücher zu anderen Sprachen nutzbar wird.
Content:
Schlagwörter: XML-Annotation, koloniale Lexikographie, Wörterbücher, Mayasprachen, Korpuslinguistik, unstandardisierte Orthographie
Content:
Keywords: XML-annotation, colonial lexicographies, dictionaries, Mayan languages, corpus linguistics, unstandardized orthographies
Language:
German
URN:
urn:nbn:de:gbv:7-dariah-2017-2-3
URL:
Volltext
(kostenfrei)
URL:
Volltext
(kostenfrei)
Bookmarklink