Families and resemblances

29 november 2010

Promotie: mw. J. Prokic, 13.15 uur, Academiegebouw, Broerstraat 5, Groningen

Proefschrift: Families and resemblances

Promotor(s): prof.dr.ir. J. Nerbonne

Faculteit: Letteren

Nieuwe methodieken voor meten van taalvariëteiten

Dialectometrie is een multidisciplinair onderzoeksgebied dat kwantitatieve methoden inzet voor de analyse van dialectgegevens. Aanvankelijk was onderzoek binnen dialectometrie vooral gericht op het gebruik van grote hoeveelheden gegevens voor analyses en het bieden van nieuwe inzichten voor onderzoekers. Later werd dialectometrie ingezet voor de identiﬁcatie van dialectgroepen en de ontwikkeling van methoden die blootleggen hoe gelijk (of ongelijk) één variëteit is ten opzichte van naburige taalvariëteiten. In haar proefschrift beschrijft Jelena Prokic de vooruitgang van verschillende technieken die de onderzoeker in staat stelt om geautomatiseerd verschillen te meten tussen taalvariëteiten. Alle methoden worden getest op Bulgaarse dialectuitspraakgegevens.

Een deel van Prokic’ onderzoek is gebaseerd op het Levenshtein algoritme, dat wordt gebruikt voor het aggregeren van de vele kenmerken van de dialectgegevens om daarmee de overeenkomsten/afstanden tussen de dialectgroepen af te leiden. Prokic onderzocht de toepassing van clustertechnieken voor het determineren van dialectgroepen en draagt verschillende evaluatietechnieken aan die gebruikt kunnen worden voor het schatten van de kwaliteit van de geautomatiseerd verkregen groepen. Voor het geautomatiseerd aﬂeiden van de afstanden tussen de fonemen in de gegevensverzameling, combineert ze het Levenshtein algoritme met de informationstheoretische techniek pointwise mutual information. Prokic gebruikt de (empirische) frequentie van foneemcorrespondenties in alignments on de afstanden tussen fonemen beter in te schatten. In het proefschrift wordt ook een alternatieve benadering van dialectvariatie getest. Prokic past een methode toe die gebruikt wordt binnen de phylogenetica, namelijk Bayesiaanse inferentie van phylogenetica, die systematisch op gemeenschappelijke innovaties als teken van een gedeelde afkomst focust, en beoordeelt opnieuw de gerelateerdheid tussen de Bulgaarse dialectvariëteiten.

De resultaten van het toepassen van verschillende kwantitatieve methoden op de Bulgaarse dialectgegevens, laten zien dat er bij sommige traditionele indelingen van dit gebied vraagtekens gezet kunnen worden, in het bijzonder als slechts uitspraakgegevens in beschouwing genomen worden. De vergelijking van de indelingen voortkomend uit de geograﬁsche en historische benadering, laat zien dat deze twee verschillende perspectieven eenzelfde beeld laten zien van de Bulgaarse dialectvariatie. Geen van de ontwikkelde methoden is taalspeciﬁek, noch slechts toepasbaar op dialectgegevens.

Jelena Prokic (Servië, 1975) studeerde computational linguistics aan de universiteit van Tübingen, Duitsland. Ze verrichtte haar onderzoek bij het Center for Language and Cognition Groningen, vakgroep alfa-informatica, aan de Faculteit der Letteren. Prokic is nu postdoc-onderzoeker aan de Ludwig Maximilians Universiteit in München.

Laatst gewijzigd:13 maart 2020 01:17

Deel dit Facebook LinkedIn

View this page in: English