Skip to ContentSkip to Navigation
OnderwijsStudievoorlichtingMeer keuzeactiviteitenScholierenacademie
Header image Blog: Dit is wetenschap

Ontmaskerd worden op basis van wat je schrijft

Datum:28 februari 2017
Worden deze woorden door mannen of door vrouwen gebruikt?
Worden deze woorden door mannen of door vrouwen gebruikt?

Woensdag 1 februari vond de verkiezing voor de RUG Docent van het Jaar 2016 plaats. De grote winnaar: Dr. Malvina Nissim van de Faculteit der Letteren! Dr. Nissim is wetenschapper in de zogeheten computationele taalkunde en doet samen met haar studenten onderzoek naar onder andere auteursprofilering en auteursidentificatie.

Auteursprofilering

Op basis van onderzoek kan geprobeerd worden om een soort profiel te schetsen van een bepaalde auteur. Is de auteur bijvoorbeeld jong of juist oud, een man of een vrouw? Dit wordt auteursprofilering genoemd. Het idee hierachter is dat de manier van schrijven van een auteur hetzelfde als een soort vingerafdruk is: net zoals iedereen een unieke vingerafdruk heeft, heeft ook iedereen zijn eigen unieke schrijfstijl.

Op basis van een onderzoek naar berichten op Facebook van mannelijke en vrouwelijk gebruikers werd de volgende wordcloud gemaakt. Wat denk je, is de wordcloud in de afbeelding er een van de vrouwelijke Facebookgebruikers of de mannelijke?

Grote kans dat je koos voor vrouwen (die voor mannen kan helaas niet worden opgenomen in dit blog in verband met een aantal niet zo nette woorden in de cloud, maar het idee is hopelijk duidelijk).

Nog een ander leuk testje dat dr. Nissim in haar college afnam bij haar publiek: welke emoticon gebruik jij? :) of :-)?

Koos je voor de tweede? Dan ben je volgens dr. Nissim waarschijnlijk… oud! De eerste emoticon is namelijk een teken van jeugdigheid. Op deze manier zijn er allerlei kenmerken toe te schrijven aan een bepaald persoon en kan er dus een soort profiel worden geschetst van diegene.

Auteursidentificatie

Naast auteursprofilering doet dr. Nissim ook onderzoek naar auteursidentificatie. Teksten kunnen met elkaar vergeleken worden, zo kunnen we twee teksten naast elkaar leggen en een poging doen om te beoordelen of die teksten geschreven zijn door dezelfde persoon. Maar is het ook mogelijk een machine te ontwerpen die dit kan? Samen met haar studenten ontwierp dr. Nissim een dergelijke machine en daarmee deden ze mee aan een internationale wedstrijd. Ze werden hier eerste met een percentage van zo’n 70% goede voorspellingen. Dit lijkt een hoog percentage, maar zegt dit eigenlijk wel wat? Om hierachter te komen, stelt dr. Nissim, moeten we weten wat een mens zou doen. Hoe zou een mens scoren op een auteursherkenningstest? Wat blijkt: een mens scoort ook 70%. Het opmerkelijke is dat dit echter niet dezelfde 70% is als de machine: blijkbaar let de machine op andere dingen als een mens. Volgens dr. Nissim reden voor nog veel meer toekomstig onderzoek. 

Dit zijn natuurlijk allemaal leuke feiten, maar wat wordt er in de praktijk nou met deze kennis gedaan? Onlangs heeft een machine als deze bijvoorbeeld J.K Rowling ontmaskerd! J.K Rowling schreef naast haar Harry Potter-boeken ook romans onder het pseudoniem Robert Galbraith. Teksten van meerdere schrijvers (waaronder Rowling en Galbraith) werden in een machine gestopt, en wat bleek? De teksten van Rowling en Galbraith bezaten, in tegenstelling tot andere schrijvers, extreme overeenkomsten. Dit vormde op zichzelf natuurlijk nog geen bewijs, maar het was wel de aanleiding voor Sunday Times om haar agent te ondervragen. Op 13 juni 2013 gaf J.K Rowling toe dat ze onder het pseudoniem van Robert Galbraith had geschreven. Had je ooit gedacht dat een machine de aanleiding van deze ontmaskering had kunnen zijn?

Tags: Nederlands, Alfa

Reacties

Reacties laden...