Skip to ContentSkip to Navigation
Over onsNieuws en agendaNieuwsberichten

Het ontleedkundig laboratorium

31 januari 2012

Oratie: dhr. prof.dr. G.J.M. van Noord, 16.00 uur, Aula Academiegebouw, Broerstraat 5, Groningen

Titel: Het ontleedkundig laboratorium

Leeropdracht: Taaltechnologie

Faculteit: Letteren

De oratie van Gertjan van Noord gaat over het automatisch ontleden van het Nederlands. Om een computer taal te laten begrijpen, is een belangrijke eerste stap automatische ontleding: welke woorden horen bij elkaar, en wat is de rol van de verschillende woorden en woordgroepen. Het maakt bijvoorbeeld nogal wat verschil of je onderwerp of lijdend voorwerp bent, getuige de volgende twee voorbeelden:

- de paus heeft gisteren een sappige biefstuk te eten gehad

- de paus heeft gisteren tweehonderd daklozen te eten gehad

In zijn rede legt Van Noord uit welke problemen de computer moet oplossen, en tot welke prestaties de computer momenteel in staat is. Daarbij worden twee - enigszins tegenstrijdige - conclusies getrokken. Aan de ene kant is de kwaliteit van de ontleding nog voor enorme verbeteringen vatbaar. Vooral als je kijkt naar de problemen die de computer heeft met allerlei onvolkomenheden in de invoer, zoals spelfouten en grammaticale fouten, of de taal van de nieuwe media zoals Twitter:

- tesssssx Normaal zou k me nu aant klaarmaken zyn vo scorro, mrgoed geen oog dicht gedaan vanacht &ben sick.. Dus f*ck school :-) #trusttteeeeeee

Ook als je gesproken taal zou willen kunnen ontleden, blijkt dat de automatische ontleding nog lang niet flexibel genoeg is. Spreektaal bestaat meestal niet uit nette zinnen:

- en verder een uh een opening God ik weet allemaal niet hoe dat heet een uh opening voor de 't luik.

De andere conclusie die in de oratie wordt getrokken is, dat de kwaliteit van de automatische ontleding voor verzorgde geschreven taal, bijvoorbeeld krantenberichten, al heel goed is, en vermoedelijk nauwelijks nog verbeterd zal kunnen worden.

In de toekomst zal het onderzoek zich daarom aan de ene kant richten op nieuwe technieken die veel flexibeler met onverwachte input om kunnen gaan. Aan de andere kant zal het onderzoek zich ook richten op de toepassing van de automatische ontleding, bijvoorbeeld als hulpmiddel bij ander taalkundig onderzoek.

Laatst gewijzigd:15 september 2017 15:42
printOok beschikbaar in het: English

Meer nieuws

  • 21 juni 2018

    Grenzeloos lallen met Martijn Wieling op Lowlands Science

    Het is bekend dat alcoholgebruik spraak negatief beïnvloedt, maar hoe zit dat bij het spreken van een vreemde taal? Onderzoek suggereert dat het effect hier juist positief lijkt te zijn. Onduidelijk is echter wat er in de mond gebeurt. Dr. Martijn Wieling...

  • 08 juni 2018

    Waardedaling woningen in aardbevingsgebied tot 2015 gemiddeld 9,3%

    Woningen in het Groningse aardbevingsgebied zijn tot 2015 gemiddeld 9,3% in waarde gedaald. Dat concluderen promovendus Nicolás Durán en hoogleraar Ruimtelijke Econometrie Paul Elhorst van de Rijksuniversiteit Groningen. Zij analyseerden data van de...

  • 06 juni 2018

    RUG op plek 120 in QS ranking

    De Rijksuniversiteit Groningen (RUG) staat dit jaar op plaats 120 in de QS World Top University Rankings 2019. Afgelopen twee jaar stond de RUG opplaats 113 in deze lijst van bijna 1.000 universiteiten wereldwijd. Op nationale schaal is Groningen dit...