Catching words in a stream of speech. Computational simulations of segmenting transcribed child-directed speech

08 december 2011

Promotie: dhr. C. Çöltekin, 14.30 uur, Aula Academiegebouw, Broerstraat 5, Groningen

Proefschrift: Catching words in a stream of speech. Computational simulations of segmenting transcribed child-directed speech

Promotor(s): prof.dr.ir. J. Nerbonne

Faculteit: Letteren

Onderzoek naar segmentatie van spraak met nieuwe modellen

De segmentatie van continue spraak in lexicale eenheden is een van de eerste vaardigheden die een kind moet leren gedurende de taalverwerving. Promovendus Çağrı Çöltekin onderzocht segmentatie met behulp van computationeel modelleren en computationele simulaties.

Segmentatie is moeilijker dan het op het eerste gezicht lijkt. Kinderen moeten woorden vinden in een continue stroom van spraak, zonder kennis van woorden te hebben. Gelukkig laten experimentele studies zien dat kinderen en volwassen een aantal aanwijzingen uit de invoer gebruiken, alsmede simpele strategieën die gebruik maken van deze aanwijzingen, om spraak te segmenteren. Nog interessanter is dat een aantal van deze aanwijzingen taal-onafhankelijk zijn, waardoor een taalverwerver continue input kan segmenteren voordat het een enkel woord kent.

De modellen die Çöltekin in zijn proefschrift voorstelt, verschillen op twee belangrijke vlakken van modellen uit de literatuur. Ten eerste gebruiken ze lokale strategieën, in tegenstelling tot globale optimalisatie, die gebruikmaken van aanwijzingen waarvan bekend is dat kinderen ze gebruiken, namelijk voorspelbaarheidsstatistieken, fonotactiek en lexicale beklemtoning. Ten tweede worden deze aanwijzingen gecombineerd met behulp van een expliciet aanwijzing-combinatie model, dat eenvoudig uitgebreid kan worden met meer aanwijzingen.

Deze modellen zijn getest met behulp van reële getranscribeerde kindgerichte spraak. De resultaten van de simulaties laten zien dat de prestaties van de individuele strategieën vergelijkbaar zijn met state-of-the-art computationele modellen voor segmentatie. Daarnaast levert het combineren van individuele aanwijzingen een consistente verbetering in prestaties op. Het gecombineerde model presteert even goed als het state-of-the-art model dat als referentie gebruikt wordt, terwijl het alleen gebruik maakt van mechanismen die beter vergelijkbaar zijn met mechanismen die voorhanden zijn voor mensen die dezelfde taak verrichten.

Çağrı Çöltekin (Turkije, 1972) studeerde Cognitive Science aan de Middle East Technical University te Ankara. Hij verrichtte zijn onderzoek bij het Center for Language and Cognition Groningen van de RUG, waar hij werkt bij de afdeling alfa-informatica.

Laatst gewijzigd:

13 maart 2020 01:13

Deel dit Facebook LinkedIn

View this page in: English

Meer nieuws

10 juli 2025

Vanaf 2026 nieuw bachelorprogramma Fries in Groningen

De Rijksuniversiteit Groningen (RUG), het ministerie van Onderwijs, Cultuur en Wetenschap (OCW), het ministerie van Binnenlandse Zaken en Koninkrijksrelaties (BZK) en de provincie Fryslân tekenen op 10 juli een convenant waardoor het vanaf september...
04 juli 2025

RUG reikt verschillende prijzen uit tijdens Ceremony of Merits

De RUG heeft verschillende prijzen uitgereikt aan excellente onderzoekers en studenten tijdens de Ceremony of Merits op 4 juli 2025.
03 juli 2025

Forse subsidie Nij Begun voor project digicoaches Groningen en Noord-Drenthe

In alle gemeenten in Groningen en Noord-Drenthe komt er ruimte om mensen met een afstand tot de arbeidsmarkt op te leiden tot digicoach. Het initiatief hiervoor komt van de Digital Literacy Coalition (DLC): een netwerk van organisaties die zich...

Catching words in a stream of speech. Computational simulations of segmenting transcribed child-directed speech

Meer nieuws

Vanaf 2026 nieuw bachelorprogramma Fries in Groningen

RUG reikt verschillende prijzen uit tijdens Ceremony of Merits

Forse subsidie Nij Begun voor project digicoaches Groningen en Noord-Drenthe