Annotation for Machine Learning

Faculteit Letteren
Jaar 2022/23
Vakcode LIX025P05
Vaknaam Annotation for Machine Learning
Voertaal Engels
Periode semester II b
ECTS 5
Rooster rooster.rug.nl

Uitgebreide vaknaam Annotation for Machine Learning
Leerdoelen In deze cursus leren studenten hoe een annotatiedoel te definiëren voor een gegeven NLP-taak, hoe een dataset te verzamelen, een annotatiemodel te definiëren, de annotaties te evalueren en te beoordelen, een gouden standaard corpus te creëren, een verscheidenheid aan statistische analyses uit te voeren op het corpus, verschillende machine learning (ML) algoritmen te trainen op de dataset door effectieve kenmerken te selecteren uit de annotaties, de geleerde ML-modellen te evalueren en hun evaluatieresultaten te vergelijken, en een (sterk) basismodel te ontwikkelen voor de initiële NLP-taak.
Omschrijving Geannoteerde natuurlijke taalgegevens zijn een cruciaal onderdeel van natuurlijke taalverwerking. Annotatie van data is een proces van het toevoegen van meta-informatie aan de tekst om zo computers te faciliteren om natuurlijke taalverwerking te leren. De cursus zal onderzoeken hoe annotatie van natuurlijke taal tekst kan leiden tot het verhogen van de prestaties van machine learning algoritmen. In het bijzonder zal de cursus een meerfasig proces aanleren voor het bouwen van je eigen geannoteerde natuurlijke taal dataset (aka corpus) voor het trainen en testen van machine learning algoritmes voor een bepaalde taak.
Uren per week 4
Onderwijsvorm computerpracticum, hoorcollege
(2 uur hoorcollege, 2 uur computer practicum)
Toetsvorm nog niet bekend, opdrachten, programmeeropdrachten, tentamen
(schriftelijk 3 uur)
Vaksoort bachelor
Coördinator F. Tsiwah, PhD.
Docent(en) F. Tsiwah, PhD.
Entreevoorwaarden Inleiding Programmeren I behaald en Taaloptimalisatie gevolgd.
Opmerkingen Studenten die dit vak volgen als tweedejaarsvak volgen krijgen extra opdrachten.
Opgenomen in
Opleiding Jaar Periode Type
BSc Informatiekunde 1 semester II b verplicht
BSc Informatiekunde  (Pre-master Information Science) - semester II b verplicht