Uitgebreide vaknaam |
Annotation for Machine Learning |
Leerdoelen |
In deze cursus leren studenten hoe een annotatiedoel te definiëren voor een gegeven NLP-taak, hoe een dataset te verzamelen, een annotatiemodel te definiëren, de annotaties te evalueren en te beoordelen, een gouden standaard corpus te creëren, een verscheidenheid aan statistische analyses uit te voeren op het corpus, verschillende machine learning (ML) algoritmen te trainen op de dataset door effectieve kenmerken te selecteren uit de annotaties, de geleerde ML-modellen te evalueren en hun evaluatieresultaten te vergelijken, en een (sterk) basismodel te ontwikkelen voor de initiële NLP-taak. |
Omschrijving |
Geannoteerde natuurlijke taalgegevens zijn een cruciaal onderdeel van natuurlijke taalverwerking. Annotatie van data is een proces van het toevoegen van meta-informatie aan de tekst om zo computers te faciliteren om natuurlijke taalverwerking te leren. De cursus zal onderzoeken hoe annotatie van natuurlijke taal tekst kan leiden tot het verhogen van de prestaties van machine learning algoritmen. In het bijzonder zal de cursus een meerfasig proces aanleren voor het bouwen van je eigen geannoteerde natuurlijke taal dataset (aka corpus) voor het trainen en testen van machine learning algoritmes voor een bepaalde taak. |
Uren per week |
4 |
Onderwijsvorm |
computerpracticum, hoorcollege
(2 uur hoorcollege, 2 uur computer practicum)
|
Toetsvorm |
nog niet bekend, opdrachten, programmeeropdrachten, tentamen
(schriftelijk 3 uur)
|
Vaksoort |
bachelor
|
Coördinator |
Prof. Dr. M. Nissim
|
Docent(en) |
G.F. Minnema
,Prof. Dr. M. Nissim
|
Entreevoorwaarden |
Inleiding Programmeren I behaald en Taaloptimalisatie gevolgd. |
Opmerkingen |
Studenten die dit vak volgen als tweedejaarsvak volgen krijgen extra opdrachten. |
Opgenomen in |
|