Families and resemblances
Promotie: mw. J. Prokic, 13.15 uur, Academiegebouw, Broerstraat 5, Groningen
Proefschrift: Families and resemblances
Promotor(s): prof.dr.ir. J. Nerbonne
Faculteit: Letteren
Nieuwe methodieken voor meten van taalvariëteiten
Dialectometrie is een multidisciplinair onderzoeksgebied dat kwantitatieve methoden inzet voor de analyse van dialectgegevens. Aanvankelijk was onderzoek binnen dialectometrie vooral gericht op het gebruik van grote hoeveelheden gegevens voor analyses en het bieden van nieuwe inzichten voor onderzoekers. Later werd dialectometrie ingezet voor de identificatie van dialectgroepen en de ontwikkeling van methoden die blootleggen hoe gelijk (of ongelijk) één variëteit is ten opzichte van naburige taalvariëteiten. In haar proefschrift beschrijft Jelena Prokic de vooruitgang van verschillende technieken die de onderzoeker in staat stelt om geautomatiseerd verschillen te meten tussen taalvariëteiten. Alle methoden worden getest op Bulgaarse dialectuitspraakgegevens.
Een deel van Prokic’ onderzoek is gebaseerd op het Levenshtein algoritme, dat wordt gebruikt voor het aggregeren van de vele kenmerken van de dialectgegevens om daarmee de overeenkomsten/afstanden tussen de dialectgroepen af te leiden. Prokic onderzocht de toepassing van clustertechnieken voor het determineren van dialectgroepen en draagt verschillende evaluatietechnieken aan die gebruikt kunnen worden voor het schatten van de kwaliteit van de geautomatiseerd verkregen groepen. Voor het geautomatiseerd afleiden van de afstanden tussen de fonemen in de gegevensverzameling, combineert ze het Levenshtein algoritme met de informationstheoretische techniek pointwise mutual information. Prokic gebruikt de (empirische) frequentie van foneemcorrespondenties in alignments on de afstanden tussen fonemen beter in te schatten. In het proefschrift wordt ook een alternatieve benadering van dialectvariatie getest. Prokic past een methode toe die gebruikt wordt binnen de phylogenetica, namelijk Bayesiaanse inferentie van phylogenetica, die systematisch op gemeenschappelijke innovaties als teken van een gedeelde afkomst focust, en beoordeelt opnieuw de gerelateerdheid tussen de Bulgaarse dialectvariëteiten.
De resultaten van het toepassen van verschillende kwantitatieve methoden op de Bulgaarse dialectgegevens, laten zien dat er bij sommige traditionele indelingen van dit gebied vraagtekens gezet kunnen worden, in het bijzonder als slechts uitspraakgegevens in beschouwing genomen worden. De vergelijking van de indelingen voortkomend uit de geografische en historische benadering, laat zien dat deze twee verschillende perspectieven eenzelfde beeld laten zien van de Bulgaarse dialectvariatie. Geen van de ontwikkelde methoden is taalspecifiek, noch slechts toepasbaar op dialectgegevens.
Jelena Prokic (Servië, 1975) studeerde computational linguistics aan de universiteit van Tübingen, Duitsland. Ze verrichtte haar onderzoek bij het Center for Language and Cognition Groningen, vakgroep alfa-informatica, aan de Faculteit der Letteren. Prokic is nu postdoc-onderzoeker aan de Ludwig Maximilians Universiteit in München.
Laatst gewijzigd: | 13 maart 2020 01:17 |
Meer nieuws
-
16 september 2025
Ruimte voor kunst: hoe creativiteit en wetenschap samen kunnen gaan
Het Nederlandse platteland is in transitie: uiteenlopende claims op landgebruikbotsen, infrastructurele ingrepen veranderen het landschap, en leefbaarheid staat onder druk door krimp en vergrijzing. Cultureel geograaf en sociaal planoloog Gwenda van...
-
15 september 2025
Succesvol bezoek aan de RUG door Rector van het Institut Teknologi Bandung
De Rector van het Institut Teknologi Bandung (ITB), prof. Tatacipta Dirgantara, bracht van een driedaags bezoek aan de Rijksuniversiteit Groningen.
-
09 september 2025
Kunst + wetenschap = 1-0 voor de medemenselijkheid
Promovendus Media Studies Marije Miedema en theatermaker Mees van den Bergh bundelden hun krachten. Het resultaat is de theatrale audio-installatie ‘Toekomst van het verleden’, een project over hoe mensen digitaal herinnerd willen worden.