Skip to ContentSkip to Navigation
Maatschappij/bedrijvenIndustry Relations

Analyse van Twitterberichten via machine learning

Inhoud onderzoek

Politici en journalisten plaatsen steeds vaker berichten op Twitter. De inhoud is interessant voor wetenschappelijk onderzoek, bijvoorbeeld om te kijken hoe zij zich online gedragen. Om de berichten te analyseren moeten ze eerst gecodeerd worden om vergelijkbare berichten te groeperen, bijvoorbeeld: voeren ze campagne, gaan ze in discussie, bekritiseren ze concurrenten, enzovoort. Dat gebeurt nu handmatig, maar dit is een tijdrovend proces. Onderzoekers van de Faculteit der Letteren aan de RUG onderzoeken daarom of het proces van coderen en analyseren geautomatiseerd kan worden. Samen met het Centrum voor Informatie Technologie (CIT) van de RUG hebben zij een zogeheten Twittercrawler ontworpen. Deze applicatie zorgt ervoor dat een selectie van Twitterberichten wordt binnengehaald, gecodeerd en geanalyseerd. De uitdaging hierbij is dat het gaat om interpretatie van gedrag in teksten. Daarin zit altijd een zekere ambiguïteit, iets waar computers normaalgesproken slecht mee uit de voeten kunnen. Daarom worden machine-learning-algoritmes ontwikkeld: als er voldoende met de hand gecodeerde berichten worden ingelezen, leert het algoritme daarvan. Op basis van het geleerde is het algoritme in staat om berichten automatisch te coderen.

De Twittercrawler kan berichten coderen en analyseren
De Twittercrawler kan berichten coderen en analyseren

In de praktijk

Dit project maakt het dus mogelijk om vergelijkend wetenschappelijk onderzoek te doen naar gedrag, in dit geval van politici en journalisten. Maar wat moeten we ons daarbij voorstellen? Een goed voorbeeld is een eerder onderzoek naar het online gedrag van Britse, Nederlandse, Italiaanse en Zweedse politici. Een belangrijke vraag hierbij was onder meer in hoeverre politici met burgers in debat gaan. Vaak wordt gesteld dat sociale media dat mogelijk maken. Maar gebeurt het ook echt? Uit de resultaten bleek onder meer dat Nederlandse politici veel meer direct contact met burgers hebben over belangrijke onderwerpen dan Britse politici. In een ander onderzoek naar online gedrag zijn de Twitterberichten van Nederlandse en Vlaamse journalisten uitvoerig geanalyseerd. Daaruit kwam onder meer naar voren dat freelance journalisten meer bezig zijn met het onderhouden van contacten, met zichzelf als ‘merk’ te verkopen op Twitter, terwijl journalisten in vaste dienst hun eigen stukken juist vaker promoten.

Gezamenlijke kansen

Het algoritme om de Twitterberichten automatisch te coderen, zou na enkele aanpassingen ook toepasbaar kunnen zijn op datasets uit een andere context. Ook is er in de toekomst geen beperking meer in het aantal berichten dat kan worden gecodeerd. Dit maakt het algoritme interessant voor nieuw onderzoek. Voor wetenschappers, maar ook voor bedrijven en andere organisaties die big data willen analyseren. Een toepassing is bijvoorbeeld het filteren en verzamelen van nieuwsberichten, waardoor relevante informatie direct op een nieuwswebsite kan worden geplaatst.

Hoogleraar Marcel Broersma, Faculteit der Letteren aan de RUG: ‘Bij dit project komen verschillende expertises samen’

‘Een Twitterbericht vertelt ons meer dan je in eerste instantie misschien zou verwachten. Naast algemene informatie, zoals de naam van degene die het plaatste en tijd van plaatsing, kun je elk bericht ook zien als een bepaalde vorm van gedrag. Politici geven bijvoorbeeld een campagne-update of gaan in debat met burgers. Met name dit gedrag op Twitter is interessant voor vergelijkend wetenschappelijk onderzoek. Maar informatie over gedrag ligt niet zo aan de oppervlakte als de algemene informatie; het vereist een interpretatieslag. Daarom combineert ons project de expertise van computerwetenschappers met de expertise van onderzoekers op het gebied van politieke communicatie en journalistiek.’

In het kort
Projectpartners: Rijksuniversiteit Groningen, Netherlands eScience Center en het Centrum voor Informatie Technologie (CIT, onderdeel RUG)
Projectleider: prof. dr. Marcel Broersma (RUG/Faculteit der Letteren)
Bijzonderheden: Het onderzoekstraject behorende bij dit project is ondersteund met meerdere subsidies

Laatst gewijzigd:28 maart 2018 11:48