Zoekmachines

Faculteit Letteren
Jaar 2022/23
Vakcode LIX019B05
Vaknaam Zoekmachines
Niveau(s) bachelor
Voertaal Nederlands
Periode semester I a
ECTS 5
Rooster rooster.rug.nl

Uitgebreide vaknaam Zoekmachines
Leerdoelen • Inzicht in modellen van zoekmachines, de verschillende inwendige structuren en processen en diverse additionele technieken bij de query-interpretatie en informatie-extractie.
• Kennis van en ervaring met evaluatie van de prestaties van zoekmachines.
• Kennis en ervaring met geavanceerd programmeren voor grote data-verzamelingen
Omschrijving Dit college behandelt de methoden en technieken die gebruikt worden in informatiesystemen voor ongestructureerde of semi-gestructureerde tekst, zoals zoekmachines (information retrieval). Aan de orde komen o.a tekstbehandeling en indexeren, boolean- en vectormodellen voor zoeksystemen, ranked retrieval, evaluatie van zoeksystemen, het pagerank algoritme.

De verschillende technieken en algoritmen worden aan de hand van Python programmeeropdrachten verduidelijkt, waarbij veel aandacht is voor de efficientie van de programmatuur onder de aanname dat er zeer grote tekstverzamelingen moeten worden verwerkt.
Uren per week 4
Onderwijsvorm hoorcollege, practicum
(2 uur hoorcollege, 2 uur computer practicum)
Toetsvorm tentamen
(schriftelijk 2 uur)
Vaksoort bachelor jr 2
Co├Ârdinator prof. dr. G.J.M. van Noord
Docent(en) prof. dr. G.J.M. van Noord
Verplichte literatuur
Titel Auteur ISBN Prijs
Introduction to Information Retrieval Cambridge University Press, website:http://nlp.stanford.edu/IR-book/information-retrieval-book.html C.D. Manning, P. Raghavan, H. Sch├╝tze 978-0-521-86571-5 ca. €  58,00
Entreevoorwaarden Na het behaald hebben van LIX016P05 Gevorderd Programmeren en LIX017P05 Project Tekstanalyse.
Opmerkingen Het boek is in pdf-vorm ook gratis beschikbaar.
Opgenomen in
Opleiding Jaar Periode Type
BSc Informatiekunde 2 semester I a verplicht