Families and resemblances
Promotie: mw. J. Prokic, 13.15 uur, Academiegebouw, Broerstraat 5, Groningen
Proefschrift: Families and resemblances
Promotor(s): prof.dr.ir. J. Nerbonne
Faculteit: Letteren
Nieuwe methodieken voor meten van taalvariëteiten
Dialectometrie is een multidisciplinair onderzoeksgebied dat kwantitatieve methoden inzet voor de analyse van dialectgegevens. Aanvankelijk was onderzoek binnen dialectometrie vooral gericht op het gebruik van grote hoeveelheden gegevens voor analyses en het bieden van nieuwe inzichten voor onderzoekers. Later werd dialectometrie ingezet voor de identificatie van dialectgroepen en de ontwikkeling van methoden die blootleggen hoe gelijk (of ongelijk) één variëteit is ten opzichte van naburige taalvariëteiten. In haar proefschrift beschrijft Jelena Prokic de vooruitgang van verschillende technieken die de onderzoeker in staat stelt om geautomatiseerd verschillen te meten tussen taalvariëteiten. Alle methoden worden getest op Bulgaarse dialectuitspraakgegevens.
Een deel van Prokic’ onderzoek is gebaseerd op het Levenshtein algoritme, dat wordt gebruikt voor het aggregeren van de vele kenmerken van de dialectgegevens om daarmee de overeenkomsten/afstanden tussen de dialectgroepen af te leiden. Prokic onderzocht de toepassing van clustertechnieken voor het determineren van dialectgroepen en draagt verschillende evaluatietechnieken aan die gebruikt kunnen worden voor het schatten van de kwaliteit van de geautomatiseerd verkregen groepen. Voor het geautomatiseerd afleiden van de afstanden tussen de fonemen in de gegevensverzameling, combineert ze het Levenshtein algoritme met de informationstheoretische techniek pointwise mutual information. Prokic gebruikt de (empirische) frequentie van foneemcorrespondenties in alignments on de afstanden tussen fonemen beter in te schatten. In het proefschrift wordt ook een alternatieve benadering van dialectvariatie getest. Prokic past een methode toe die gebruikt wordt binnen de phylogenetica, namelijk Bayesiaanse inferentie van phylogenetica, die systematisch op gemeenschappelijke innovaties als teken van een gedeelde afkomst focust, en beoordeelt opnieuw de gerelateerdheid tussen de Bulgaarse dialectvariëteiten.
De resultaten van het toepassen van verschillende kwantitatieve methoden op de Bulgaarse dialectgegevens, laten zien dat er bij sommige traditionele indelingen van dit gebied vraagtekens gezet kunnen worden, in het bijzonder als slechts uitspraakgegevens in beschouwing genomen worden. De vergelijking van de indelingen voortkomend uit de geografische en historische benadering, laat zien dat deze twee verschillende perspectieven eenzelfde beeld laten zien van de Bulgaarse dialectvariatie. Geen van de ontwikkelde methoden is taalspecifiek, noch slechts toepasbaar op dialectgegevens.
Jelena Prokic (Servië, 1975) studeerde computational linguistics aan de universiteit van Tübingen, Duitsland. Ze verrichtte haar onderzoek bij het Center for Language and Cognition Groningen, vakgroep alfa-informatica, aan de Faculteit der Letteren. Prokic is nu postdoc-onderzoeker aan de Ludwig Maximilians Universiteit in München.
Laatst gewijzigd: | 13 maart 2020 01:17 |
Meer nieuws
-
04 juli 2025
RUG reikt verschillende prijzen uit tijdens Ceremony of Merits
De RUG heeft verschillende prijzen uitgereikt aan excellente onderzoekers en studenten tijdens de Ceremony of Merits op 4 juli 2025.
-
03 juli 2025
Flinke financiële steun Nij Begun voor project digicoaches Groningen en Noord-Drenthe
In alle gemeenten in Groningen en Noord-Drenthe komt er ruimte om mensen met een afstand tot de arbeidsmarkt op te leiden tot digicoach. Het initiatief hiervoor komt van de Digital Literacy Coalition (DLC): een netwerk van organisaties die zich...
-
02 juli 2025
Met NWO-subsidie zet JUST ART kunst in voor transitie klimaatrechtvaardigheid
JUST ARTontvangt 6,8 miljoen euro als onderdeel van de Nationale Wetenschapsagenda om kunst in het centrum van klimaatrechtvaardigheid te plaatsen.