Skip to ContentSkip to Navigation
Over onsNieuws en agendaNieuwsberichten

Catching words in a stream of speech. Computational simulations of segmenting transcribed child-directed speech

08 december 2011

Promotie: dhr. C. Çöltekin, 14.30 uur, Aula Academiegebouw, Broerstraat 5, Groningen

Proefschrift: Catching words in a stream of speech. Computational simulations of segmenting transcribed child-directed speech

Promotor(s): prof.dr.ir. J. Nerbonne

Faculteit: Letteren

Onderzoek naar segmentatie van spraak met nieuwe modellen

De segmentatie van continue spraak in lexicale eenheden is een van de eerste vaardigheden die een kind moet leren gedurende de taalverwerving. Promovendus Çağrı Çöltekin onderzocht segmentatie met behulp van computationeel modelleren en computationele simulaties.

Segmentatie is moeilijker dan het op het eerste gezicht lijkt. Kinderen moeten woorden vinden in een continue stroom van spraak, zonder kennis van woorden te hebben. Gelukkig laten experimentele studies zien dat kinderen en volwassen een aantal aanwijzingen uit de invoer gebruiken, alsmede simpele strategieën die gebruik maken van deze aanwijzingen, om spraak te segmenteren. Nog interessanter is dat een aantal van deze aanwijzingen taal-onafhankelijk zijn, waardoor een taalverwerver continue input kan segmenteren voordat het een enkel woord kent.

De modellen die Çöltekin in zijn proefschrift voorstelt, verschillen op twee belangrijke vlakken van modellen uit de literatuur. Ten eerste gebruiken ze lokale strategieën, in tegenstelling tot globale optimalisatie, die gebruikmaken van aanwijzingen waarvan bekend is dat kinderen ze gebruiken, namelijk voorspelbaarheidsstatistieken, fonotactiek en lexicale beklemtoning. Ten tweede worden deze aanwijzingen gecombineerd met behulp van een expliciet aanwijzing-combinatie model, dat eenvoudig uitgebreid kan worden met meer aanwijzingen.

Deze modellen zijn getest met behulp van reële getranscribeerde kindgerichte spraak. De resultaten van de simulaties laten zien dat de prestaties van de individuele strategieën vergelijkbaar zijn met state-of-the-art computationele modellen voor segmentatie. Daarnaast levert het combineren van individuele aanwijzingen een consistente verbetering in prestaties op. Het gecombineerde model presteert even goed als het state-of-the-art model dat als referentie gebruikt wordt, terwijl het alleen gebruik maakt van mechanismen die beter vergelijkbaar zijn met mechanismen die voorhanden zijn voor mensen die dezelfde taak verrichten.

Çağrı Çöltekin (Turkije, 1972) studeerde Cognitive Science aan de Middle East Technical University te Ankara. Hij verrichtte zijn onderzoek bij het Center for Language and Cognition Groningen van de RUG, waar hij werkt bij de afdeling alfa-informatica.

Laatst gewijzigd:15 september 2017 15:40
printOok beschikbaar in het: English

Meer nieuws