Skip to ContentSkip to Navigation
Over onsNieuws en agendaNieuwsberichten

Parse selection with support vector machines

18 februari 2010

Promotie: dhr. F. Dellatorre Borges, 13.15 uur, Academiegebouw, Broerstraat 5, Groningen
Proefschrift: Parse selection with support vector machines
Promotor(s): prof.dr.ir. J. Nerbonne
Faculteit: Letteren
Contact: Francisco Dellatorre Borges, tel. 010-281 80 97 (werk), francisco.borges@gmail.com

MaxEnt geschikter voor parse selection dan SVM’s

Het doel van het promotieonderzoek van Francisco Dellatorre Borges was om SVM’s (Support Vector Machines) toe te passen op het probleem van parse selection. In het bijzonder onderzocht hij het gebruik van SVM’s bij de parse trees die Alpino genereert, om de prestaties te kunnen vergelijken met het huidige Alpino disambiguatieonderdeel, dat gebaseerd is op Maximum Entropy. Het bleek dat MaxEnt beter presteerde dan de gebruikte modellen.

De eerste vraag was of het probleem als een classificatieprobleem of als een regressieprobleem beschouwd moest worden. Volgens Dellatorre Borges is het eigenlijk een skewed regression-probleem. Hij heeft daarom voor SV Regressie gekozen. Dellatorre Borges is begonnen met het uitvoeren van kleine experimenten om de prestaties van verschillende SVR implementations en van verschillende kernels te evalueren. De MaxEnt resultaten waren beter dan de beste resultaten die met SVM verkregen waren (op dezelfde dataset). Daarna zijn SVR modellen gebouwd zonder de gebruikte hoeveelheid data te beperken. Dit legde meteen het grootste probleem bloot van het werken met SVM’s: de grote hoeveelheid computationele middelen, die nodig is voor het trainen en evalueren van de modellen. Dellatorre Borges heeft verschillende kleine modellen getraind en hun voorspellingen lineair gecombineerd. De eerste uitkomst was dat de prestatie van de voorspellingen van een enkel model inderdaad lager was dan die van de gecombineerde voorspellingen, wat laat zien dat het combineren van de resultaten van kleine modellen significante prestatievoordelen oplevert. De tweede was dat door toename van de modelgrootte, de prestaties ook significant omhoog gingen. Terwijl de prestatietoename in verhouding met de eerdere experimentele opzet veel hoger was voor SVM-modellen dan voor MaxEnt, presteerde MaxEnt nog steeds beter dan de gebruikte modellen.

Francisco Dellatorre Borges (Brazilië, 1977) studeerde natuurkunde aan de universiteit van Sao Paulo. Hij verrichtte zijn onderzoek bij de vakgroep alfa-informatica aan de Faculteit der Letteren van de Rijksuniversiteit Groningen. Dellatorre Borges werkt bij EMC.

Laatst gewijzigd:15 september 2017 15:40
printOok beschikbaar in het: English

Meer nieuws

  • 21 februari 2018

    Provincie en RUG maken werk van duurzame landbouw

    De Provincie Groningen en de Rijksuniversiteit Groningen (RUG) slaan de handen ineen om de landbouwsector verder te verduurzamen. Hiertoe wordt een Bijzondere Leerstoel Natuurinclusieve Landbouw opgericht aan de RUG. De Provincie​draagt via haar Programma...

  • 19 februari 2018

    Prinses Beatrix en Prinses Mabel bij uitreiking 4e Prins Friso Ingenieursprijs in Groningen

    Het Koninklijk Instituut Van Ingenieurs (KIVI) reikt op 21 maart 2018 voor de vierde keer de Prins Friso Ingenieursprijs uit aan de Ingenieur van het Jaar. Ook dit jaar zijn Prinses Beatrix en Prinses Mabel hierbij aanwezig. ​De Rijksuniversiteit Groningen,...

  • 15 februari 2018

    Populaire wetenschapsblogger deelt spintronicafilm

    Een filmpje over het onderzoek van RUG-natuurkundige Bart van Wees is opgepikt door de populaire wetenschapsblogger Hashem Al-Ghaili. Via zijn Facebook site is de film in een paar dagen tijd meer dan 260.000 keer bekeken en ruim 2.100 keer gedeeld....