Skip to ContentSkip to Navigation

University of Groningen Business School

Lifelong learning

Neurale netwerken: van vijand naar vriend (oplossing voor data-analyses binnen de privacywet)

05 juni 2019
Gert Haanstra
Gert Haanstra

Een blog door Gert Haanstra (docent en Analytics professional).

Tot voor kort waren neurale netwerken en ik allesbehalve goede vrienden. Waarschijnlijk is dit begonnen bij mijn eerste analytics implementatie, waarin ik ontdekte dat de voorspelmodellen van neurale netwerken vrij moeilijk uit te leggen vielen aan medewerkers. Als team kozen we daarom toch maar voor een ‘eenvoudige’ analytics methode, met een beslisboom en klassieke methodologie. Neurale netwerken werden weggezet als de ‘vijand’ en in mijn opvatting is dit nog lang zo gebleven…

De afgelopen analistenbijeenkomst van het Customer Insights Center van de Rijksuniversiteit Groningen (op 16 mei jl.) heeft daar echter verandering in gebracht. Eigenlijk begon ik in de maanden daarvoor al anders tegen het onderwerp aan te kijken, toen ik samen met studenten en bedrijven in het kader van ‘Big Data’ aan de slag ging met ‘Generative Adversarial Networks’ (GANs). De analistenbijeenkomst was hét moment om met het bedrijfsleven in discussie te gaan over deze interessante ontwikkeling. Dit alles geheel volgens de bekende aanpak van het Customer Insights Center: wetenschap en praktijk samenbrengen om samen tot nieuwe inzichten te komen (denk bijvoorbeeld aan de opleiding Impactvolle Data-analist, aangeboden door UGBS).

Data-analyses en privacy

‘Privacy’ stond tijdens de bijeenkomst hoog op de agenda, gezien dit thema het werk van analisten steeds meer beïnvloedt. De AVG-regelgeving heeft namelijk voor een stevige uitdaging gezorgd: analisten moeten hun werk goed blijven doen door inzichtvolle analyses te ontwikkelen binnen de privacywet en privacywensen van de consument.

Jaap Wieringa, hoogleraar in Onderzoeksmethoden in de Bedrijfskunde aan de RUG, vertelde over de paradox in de bereidheid van consumenten om informatie te delen met bedrijven. Consumenten geven dan wel aan privacy belangrijk te vinden, maar hun gedrag vertelt ons iets anders. Wieringa legde uit dat deze discrepantie grotendeels te verklaren is met de ‘Privacy Calculus’, welke samenhangt met de afweging die consumenten maken: Wat zijn de positieve en negatieve gevolgen voor mij als ik de informatie ga delen? En hoe groot is de kans dat die gevolgen zullen plaatsvinden?

‘Paspoortmethode’ en andere oplossingen

Gelukkig is er voor analisten een ontsnappingsroute. Er bestaan namelijk een aantal oplossingsrichtingen om te voldoen aan de privacywetgeving en voorkeuren van consumenten, en toch effectief werk te verrichten. Eén ervan gaat volgens het zogeheten ‘paspoortmodel’, waarbij consumenten de mogelijkheid krijgen om tijdelijk alleen maar relevante data te delen met een bedrijf (vergelijkbaar met het laten zien van een paspoort bij de douane). Andere oplossingen hebben betrekking op het analyseren zelf: ‘dataminimalisatie’ bijvoorbeeld, waarbij kennis op een hoger niveau wordt opgebouwd en de onderliggende oorspronkelijke data kunnen worden weggegooid, en ‘data-anonimisering’, waarbij geanalyseerd wordt op geheel anonieme datasets die een representatieve afspiegeling bieden van de werkelijkheid. Beide methoden hebben eigen specifieke uitdagingen en unieke mogelijkheden.

Neurale netwerken maken zelf datasets

Generative Adversarial Networks (GANs) zijn zo’n voorbeeld van data-anonimisering. Spreker Gillian Ponte, masterstudent Marketing Intelligence, vertelde over zijn ervaringen met het bouwen van dit soort netwerken. In essentie gaat het bij GANs om het creëren van iets (bijvoorbeeld een foto of een dataset) dat nooit bestaan heeft, maar waarvan eenieder zou denken dat het echt is. Op het moment dat je als analist zelf een dataset kan maken waarin geen echte klanten meer zitten, maar die perfect weergeeft hoe klanten zich gedragen, vermijd je alle privacygevoeligheden.

Effectieve voorspellingen

Gilian legde uit hoe dat in zijn werk gaat en welke analytische uitdagingen daarbij komen kijken. Bovendien presenteerde hij resultaten waaruit bleek dat de voorspelmodellen uit GANs evengoed presteren als modellen die gebaseerd zijn op klassieke statistiek. Met andere woorden, we kregen tijdens de analistenbijeenkomst een heuse ‘proof of the pudding’.

Aan het eind van de bijeenkomst werden er volop ideeën gedeeld over de mogelijkheden voor (commerciële) organisaties om met GANs aan de slag te gaan. Mogelijk is dit interessant voor thema’s als organisatie-overstijgende fraudedetectie en gezondheidsverbetering d.m.v. (niet-werkelijke) gezondheidsdata.

Ook bevriend raken met neurale netwerken?

Nu neurale netwerken steeds interessanter beginnen te lijken, willen we hier graag meer inzicht in krijgen. In de werkgroep omtrent Big Data – onder begeleiding van docent Esther van der Hoorn – zijn we daarom bezig de meerwaarde van GANs verder te ontdekken. De Service Design methodiek helpt ons hierbij, en we zijn momenteel bezig met de uitwerking van een eerste concept van een dergelijk product. Tot nu toe leidt dit vooral tot goede energie en veelbelovende resultaten. Wilt u meer weten over onze ontwikkelingen, en waarom ook u neurale netwerken maar beter als vriend kunt gaan beschouwen? Mail mij vooral: g.f.haanstra rug.nl.

Laatst gewijzigd:28 februari 2020 11:03

Meer nieuws