Project tekstanalyse

Faculteit Letteren
Jaar 2019/20
Vakcode LIX017P05
Vaknaam Project tekstanalyse
Niveau(s) propedeuse
Voertaal Engels
Periode semester II b
ECTS 5
Rooster >>>

Uitgebreide vaknaam Project tekstanalyse
Leerdoelen The student who masters the theory and techniques given in this course will be able to process language data with NLTK, from simple actions like tokenisation, to more complex ones like sense tagging against the WordNet database or Named Entity Recognition, possibly importing external taggers. The student will be able to understand, perform, and evaluate data annota- tion, and set up a project involving data creation and processing from scratch. The final project worked in groups will also equip the student with some competences in teamwork, and in de- signing and running a larger scale NLP system, partially using off-the-shelf tools. The student will also be aware of current issues in text processing.
Omschrijving This is an introductory course to processing large amounts of textual data. The basics of language processing, such as tokenization, POS-tagging, Named Entity Recognition, sense- tagging, etc. will be introduced both from a theoretical and practical perspective. All pro- cessing levels will be discussed in class, where the corresponding NLTK functions will also be shown, and then implemented through practical assignments which will be handed out usually at the end of each lecture, and then worked on during the Lab hours. All of the implementation will be done in Python, exploiting NLTK, a library of python functions specifically developed for language processing. Everything which is learnt during the course constitutes the building blocks of the final project, which will be carried out in groups. The project, possibly different year-to-year, will consist in developing a system to tackle a Natural Language Processing task.

See study manual for details of assignments and grading.
Uren per week 4
Onderwijsvorm computerpracticum, hoorcollege
Toetsvorm programmeeropdrachten, verslag, wekelijkse opdrachten
Vaksoort propedeuse
Coördinator prof. dr. M. Nissim
Docent(en) prof. dr. M. Nissim , student-assistent
Verplichte literatuur
Titel Auteur ISBN Prijs
TBA
Entreevoorwaarden Na het behaald of gevolgd hebben van Tekstmanipulatie (LIX005P05) en Gevorderd Programmeren (LIX016P05). Individuele uitzonderingen kunnen worden gemaakt in overleg met de docent van het vak.
Opmerkingen Progress is open van 19 november 2018 t/m 7 december 2018. De (eventuele) werkgroep intekening in Nestor is open van 12 december 07.00 uur t/m 21 december 23.59 uur. De faculteit behoudt zich het recht voor wijzigingen aan te brengen in het vakaanbod, het aantal groepen en de roostering.

Recidivisten die alleen tentamen hoeven te maken wordt ontmoedigd om zich aan te melden voor het vak in Progress. Zij kunnen door het secretariaat worden toegevoegd aan de cursus in Nestor. Je kunt hiervoor een mail sturen naar sec-millc@rug.nl. De faculteit behoudt zich het recht voor wijzigingen aan te brengen in het vakaanbod, het aantal groepen en de roostering.
Opgenomen in
Opleiding Jaar Periode Type
BSc Informatiekunde 1 semester II b verplicht
BSc Informatiekunde  (Pre-master Information Science) - semester II b verplicht