Families and resemblances
Promotie: mw. J. Prokic, 13.15 uur, Academiegebouw, Broerstraat 5, Groningen
Proefschrift: Families and resemblances
Promotor(s): prof.dr.ir. J. Nerbonne
Faculteit: Letteren
Nieuwe methodieken voor meten van taalvariëteiten
Dialectometrie is een multidisciplinair onderzoeksgebied dat kwantitatieve methoden inzet voor de analyse van dialectgegevens. Aanvankelijk was onderzoek binnen dialectometrie vooral gericht op het gebruik van grote hoeveelheden gegevens voor analyses en het bieden van nieuwe inzichten voor onderzoekers. Later werd dialectometrie ingezet voor de identificatie van dialectgroepen en de ontwikkeling van methoden die blootleggen hoe gelijk (of ongelijk) één variëteit is ten opzichte van naburige taalvariëteiten. In haar proefschrift beschrijft Jelena Prokic de vooruitgang van verschillende technieken die de onderzoeker in staat stelt om geautomatiseerd verschillen te meten tussen taalvariëteiten. Alle methoden worden getest op Bulgaarse dialectuitspraakgegevens.
Een deel van Prokic’ onderzoek is gebaseerd op het Levenshtein algoritme, dat wordt gebruikt voor het aggregeren van de vele kenmerken van de dialectgegevens om daarmee de overeenkomsten/afstanden tussen de dialectgroepen af te leiden. Prokic onderzocht de toepassing van clustertechnieken voor het determineren van dialectgroepen en draagt verschillende evaluatietechnieken aan die gebruikt kunnen worden voor het schatten van de kwaliteit van de geautomatiseerd verkregen groepen. Voor het geautomatiseerd afleiden van de afstanden tussen de fonemen in de gegevensverzameling, combineert ze het Levenshtein algoritme met de informationstheoretische techniek pointwise mutual information. Prokic gebruikt de (empirische) frequentie van foneemcorrespondenties in alignments on de afstanden tussen fonemen beter in te schatten. In het proefschrift wordt ook een alternatieve benadering van dialectvariatie getest. Prokic past een methode toe die gebruikt wordt binnen de phylogenetica, namelijk Bayesiaanse inferentie van phylogenetica, die systematisch op gemeenschappelijke innovaties als teken van een gedeelde afkomst focust, en beoordeelt opnieuw de gerelateerdheid tussen de Bulgaarse dialectvariëteiten.
De resultaten van het toepassen van verschillende kwantitatieve methoden op de Bulgaarse dialectgegevens, laten zien dat er bij sommige traditionele indelingen van dit gebied vraagtekens gezet kunnen worden, in het bijzonder als slechts uitspraakgegevens in beschouwing genomen worden. De vergelijking van de indelingen voortkomend uit de geografische en historische benadering, laat zien dat deze twee verschillende perspectieven eenzelfde beeld laten zien van de Bulgaarse dialectvariatie. Geen van de ontwikkelde methoden is taalspecifiek, noch slechts toepasbaar op dialectgegevens.
Jelena Prokic (Servië, 1975) studeerde computational linguistics aan de universiteit van Tübingen, Duitsland. Ze verrichtte haar onderzoek bij het Center for Language and Cognition Groningen, vakgroep alfa-informatica, aan de Faculteit der Letteren. Prokic is nu postdoc-onderzoeker aan de Ludwig Maximilians Universiteit in München.
Laatst gewijzigd: | 13 maart 2020 01:17 |
Meer nieuws
-
08 mei 2025
Prof. dr. Petra Hendriks verkozen tot lid Academia Europaea
Prof. dr. Petra Hendriks, hoogleraar Semantiek en Cognitie aan de Faculteit der Letteren en directeur van het Center for Language and Cognition Groningen (CLCG), is verkozen tot lid van de prestigieuze Academia Europaea.
-
01 mei 2025
AI en vrijheid van meningsuiting
Zaterdag 3 mei is de Internationale Dag van de Persvrijheid. Een dag om ons bewust te zijn van het belang van persvrijheid en van onze plicht om die vrijheid van meningsuiting te respecteren en te beschermen. Die bewustwording is geen overbodige luxe...
-
22 april 2025
Liekuut | De Verenigde Staten zijn altijd al minder democratisch geweest dan we denken
De vurigheid waarmee Donald Trump de Amerikaanse democratie aan het uithollen is, lijkt nooit eerder te zijn voorgekomen. In het verleden hebben presidenten wel vaker hun macht aangewend om presidentiële decreten uit te vaardigen, maar niet in het...