From insights to impact: actionable interpretability for neural machine translation

Hoe kunnen AI-vertaalsystemen beter?
Hoe kunnen we AI-vertaalsystemen transparanter, controleerbaarder en nuttiger maken voor professionele vertalers? Die vraag stond centraal in het promotieonderzoek van Gabriele Sarti. Nu machinevertaling steeds alomtegenwoordiger wordt in onze geglobaliseerde wereld, is het begrijpen en beheersen van deze systemen cruciaal om accurate, cultureel passende vertalingen te garanderen. Sarti’s proefschrift overbrugt de kloof tussen wetenschappelijke inzichten in de werking van taalmodellen en praktische voordelen voor gebruikers van deze systemen, en baant de weg voor betere mens-AI-interactiepraktijken voor professionele vertalers en dagelijkse gebruikers wereldwijd.
Sarti ontwikkelde in zijn onderzoek nieuwe methoden om in de 'black box' van AI-vertaalmodellen te kijken om te begrijpen hoe zij beslissingen nemen. Hij ontwikkelde open-source tools en methodologische kaders om te kwantificeren hoe taalmodellen zich baseren op context om tekst te genereren, en hoe dit soms kan leiden tot ongewenste vooroordelen. Vervolgens stelt Sarti nieuwe technieken voor waarmee gebruikers vertaalstijlen kunnen sturen - bijvoorbeeld door vertalingen formeler of informeler te laten klinken, of door de schrijfstijl van specifieke menselijke vertalers na te bootsen. Dit is met name waardevol voor literaire vertaling, waar het behouden van de stem van de auteur essentieel is.
Sarti onderzocht ook hoe de interne werking van taalmodellen het dagelijkse werk van professionele vertalers kan informeren. Door middel van studies met vertalers die werken over diverse taalfamilies, tonen de bevindingen aan dat de effectiviteit van machinevertaling sterk varieert afhankelijk van taalovereenkomsten. Sarti ontwikkelde vervolgens nieuwe methoden om automatisch potentiële vertaalfouten te markeren door rekening te houden met de onzekerheid van machinevertaalmodellen, wat vertalers helpt efficiënter te werken met behoud van kwaliteit.