Catching words in a stream of speech. Computational simulations of segmenting transcribed child-directed speech
Promotie: dhr. C. Çöltekin, 14.30 uur, Aula Academiegebouw, Broerstraat 5, Groningen
Proefschrift: Catching words in a stream of speech. Computational simulations of segmenting transcribed child-directed speech
Promotor(s): prof.dr.ir. J. Nerbonne
Faculteit: Letteren
Onderzoek naar segmentatie van spraak met nieuwe modellen
De segmentatie van continue spraak in lexicale eenheden is een van de eerste vaardigheden die een kind moet leren gedurende de taalverwerving. Promovendus Çağrı Çöltekin onderzocht segmentatie met behulp van computationeel modelleren en computationele simulaties.
Segmentatie is moeilijker dan het op het eerste gezicht lijkt. Kinderen moeten woorden vinden in een continue stroom van spraak, zonder kennis van woorden te hebben. Gelukkig laten experimentele studies zien dat kinderen en volwassen een aantal aanwijzingen uit de invoer gebruiken, alsmede simpele strategieën die gebruik maken van deze aanwijzingen, om spraak te segmenteren. Nog interessanter is dat een aantal van deze aanwijzingen taal-onafhankelijk zijn, waardoor een taalverwerver continue input kan segmenteren voordat het een enkel woord kent.
De modellen die Çöltekin in zijn proefschrift voorstelt, verschillen op twee belangrijke vlakken van modellen uit de literatuur. Ten eerste gebruiken ze lokale strategieën, in tegenstelling tot globale optimalisatie, die gebruikmaken van aanwijzingen waarvan bekend is dat kinderen ze gebruiken, namelijk voorspelbaarheidsstatistieken, fonotactiek en lexicale beklemtoning. Ten tweede worden deze aanwijzingen gecombineerd met behulp van een expliciet aanwijzing-combinatie model, dat eenvoudig uitgebreid kan worden met meer aanwijzingen.
Deze modellen zijn getest met behulp van reële getranscribeerde kindgerichte spraak. De resultaten van de simulaties laten zien dat de prestaties van de individuele strategieën vergelijkbaar zijn met state-of-the-art computationele modellen voor segmentatie. Daarnaast levert het combineren van individuele aanwijzingen een consistente verbetering in prestaties op. Het gecombineerde model presteert even goed als het state-of-the-art model dat als referentie gebruikt wordt, terwijl het alleen gebruik maakt van mechanismen die beter vergelijkbaar zijn met mechanismen die voorhanden zijn voor mensen die dezelfde taak verrichten.
Çağrı Çöltekin (Turkije, 1972) studeerde Cognitive Science aan de Middle East Technical University te Ankara. Hij verrichtte zijn onderzoek bij het Center for Language and Cognition Groningen van de RUG, waar hij werkt bij de afdeling alfa-informatica.
Laatst gewijzigd: | 13 maart 2020 01:13 |
Meer nieuws
-
30 september 2025
Luitenant-generaal Elanor Boekholt-O’Sullivan ontvangt Aletta Jacobsprijs 2026
De Aletta Jacobsprijs 2026 van de Rijksuniversiteit Groningen (RUG) is toegekend aan Elanor Boekholt-O’Sullivan, de eerste vrouwelijke luitenant-generaal bij de Nederlandse krijgsmacht. De Aletta Jacobsprijs wordt op vrijdag 6 maart 2026 uitgereikt...
-
30 september 2025
Menselijke vertalers blijven nodig
Als we de media moeten geloven maakt AI deze en nog veel meer beroepen op
korte termijn overbodig. Hoogleraar Ana Guerberof Arenas heeft haar vraagtekens. In elk geval voor haar eigen vakgebied: vertalen. -
18 september 2025
De geschiedenis teruggeven aan de gemeenschap
De Groninger aardbevingsproblematiek houdt ons nog steeds bezig. Universitair docent Yuliya Hilevich werkt als projectadviseur en stagebegeleider voor het project ‘Ooggetuigen van de Gaswinning’, waarbij alles draait om de mondelinge getuigenissen...