Tentoonstelling: Geschiedenis van testen

Faculteit GMW: Heymans restaurant, 17 maart - 14 april 2026

Hoe kun je intelligentie meten? Psychologen en pedagogen zijn er al meer dan honderd jaar mee bezig, van de beroemde Binet-Simontest tot meer recentelijk de Citotoets. Ook aan de RUG werkten testontwikkelaars, zoals het echtpaar Snijders-Oomen dat de veelgebruikte SON-test ontwikkelde.

Het ADNG Erfgoedcentrum voor de Nederlandse Gedragswetenschappen heeft een tentoonstelling over de geschiedenis van het testen ingericht.

Vitrine 1: Intelligentie wordt meetbaar

Aan het begin van de twintigste eeuw werd intelligentie opgevat als een meetbare eigenschap van het individu.[1] Deze ontwikkeling hing nauw samen met de opkomst van de pedagogiek als wetenschap, de uitbreiding van het volksonderwijs en de behoefte om leerlingen systematisch te classificeren.[2] Een cruciale stap was de ontwikkeling van de Binet-Simon-test in Frankrijk (1905), die intelligentie definieerde als het vermogen tot praktisch oordelen, begrijpen en redeneren.[3] De test bestond uit een reeks leeftijdsgebonden opdrachten, waarmee het mentale niveau van een kind werd vastgesteld in relatie tot zijn kalenderleeftijd.[4] Zo ontstond het concept van de ‘mentale leeftijd’, dat een schijnbaar objectieve maat bood om leerbaarheid vast te stellen. In de test van Binet werd intelligentie niet geoperationaliseerd als een aangeboren vermogen maar als iets dat zich ontwikkelde en in pedagogische contexten betekenis kreeg.[5] Door de invoering van de leerplicht in diverse Europese landen werd het onderwijs geconfronteerd met een grotere diversiteit aan leerlingen. In deze context ontstond een toenemende behoefte aan testen als instrument om normaliteit en afwijking vast te stellen. Binnen het onderwijs werden daarom intelligentietesten ingezet bij de selectie en doorverwijzing van kinderen naar het speciale onderwijs. Vooral in het onderwijs en de zorg voor ‘achterblijvende’ of ‘zwakzinnige’ kinderen kregen intelligentietesten een centrale rol bij selectie en doorverwijzing.[6] De Binet-Simon-test is daar dan ook voor ontwikkeld.

Hoewel de Binet-Simon-test internationaal grote invloed had, werd deze nooit simpelweg letterlijk overgenomen.[7] In elk land vond een proces van vertaling, selectie en herinterpretatie plaats, waarbij de test werd aangepast aan nationale onderwijssystemen, taalgebruik en dominante opvattingen over intelligentie en opvoeding. Testitems die sterk cultureel of schoolspecifiek waren, werden vervangen of herschreven.[8] Daarmee veranderde niet alleen de vorm, maar ook de betekenis van wat gemeten werd. Dit proces laat zien dat intelligentietesten geen neutrale meetinstrumenten waren, maar dragers van culturele en ideologische aannames. Door aanpassing aan de eigen samenleving werden buitenlandse ideeën over intelligentie ‘vertaald’ naar nationale problemen en beleidsdoelen.

De vergelijking tussen Nederland en de Verenigde Staten maakt duidelijk dat men niet op dezelfde manier naar intelligentie keek, ondanks het gedeelde vertrekpunt bij Binet-Simon. In Nederland werd de test vertaald door schoolarts Dirk Herderschêe (1877–1969).[9] De Binet-Herderschêe test werd ontwikkeld als hulpmiddel bij de selectie van leerlingen voor het speciaal onderwijs.[10] Deze test maakte deel uit van een bredere medisch-pedagogische beoordeling, waarin ook observaties van artsen en leerkrachten zwaar wogen. Testresultaten werden met voorzichtigheid geïnterpreteerd en golden niet als absolute waarheid.[11] In de Verenigde Staten daarentegen kreeg het gebruik van intelligentietesten al snel een veel bredere toepassing. Onder invloed van de eugenetica en het geloof in erfelijke intelligentie werden testen ingezet voor grootschalige classificatie, onder meer in het onderwijs, het leger en immigratiebeleid.[12] Zeker de Eerste Wereldoorlog was een beslissend moment voor het gebruik van testen, de populariteit groeide alleen maar daarna. De testresultaten kregen een meer deterministisch karakter: intelligentie werd vaker gezien als aangeboren en relatief onveranderlijk. Waar in Nederland de test vooral gezien werd als ondersteunend instrument, werd deze in de VS een beslissend selectie- en legitimeringsmiddel.[13]

In Frankrijk, Nederland en de Verenigde Staten bestond een duidelijke behoefte aan intelligentietesten, maar de onderliggende motieven verschilden.[14] In Frankrijk ontstond de Binet-Simon-test uit een praktische pedagogische vraag: hoe kunnen kinderen die niet meekomen in het reguliere onderwijs tijdig worden herkend en passend onderwijs krijgen? De test moest expliciet voorkomen dat kinderen onterecht als ‘onopvoedbaar’ werden bestempeld.[15] In Nederland lag de behoefte vooral bij de organisatie van het speciaal onderwijs en de efficiëntie van het schoolsysteem.[16] Met de invoering van de leerplicht en de groei van scholen voor buitengewoon of speciaal onderwijs moest worden bepaald welke kinderen daar thuishoorden.[17] Intelligentietesten boden een ´wetenschappelijk´criterium om deze selectie te legitimeren, al bleef er discussie over misplaatsingen en de beperkte zeggingskracht van IQ-scores.[18] In de Verenigde Staten speelde naast onderwijskundige ook een sterk maatschappelijke en politieke behoefte. Testen werden gebruikt om sociale orde te scheppen in een snel industrialiserende en migrerende samenleving. Hoewel er overeenkomsten waren in de zoektocht naar objectieve classificatie, liepen de nationale doelen dus duidelijk uiteen. De Binet-Simon-test bood een flexibel kader dat ruimte liet voor aanpassing aan lokale normen, instituties en belangen. In Nederland werd de test ingebed in een medisch-pedagogische cultuur gericht op zorg en opvoedbaarheid, terwijl dezelfde test in de Verenigde Staten werd ingezet ter ondersteuning van meritocratische en soms uitsluitende praktijken. Deze geschiedenis laat zien dat intelligentietesten geen universele meetinstrumenten waren, maar knooppunten waar wetenschap, beleid en cultuur samenkwamen. De wijze waarop zij werden vertaald en gebruikt zegt daarom minstens zoveel over samenlevingen als over intelligentie zelf.

[1] Nelleke Bakker, "Professional competence and the classification and selection of pupils for schools for “feebleminded” children in the Netherlands (1900–1940)," Paedagogica Historica 57, no. 6 (2021), https://doi.org/10.1080/00309230.2020.1762681, https://dx.doi.org/10.1080/00309230.2020.1762681., 728-729

[2] Ibidem

[3] Alicia Bolaños-Medina and Víctor González-Ruiz, "Deconstructing the Translation of Psychological Tests," Meta 57, no. 3 (2012), https://doi.org/10.7202/1017088ar. http://dx.doi.org/10.7202/1017088ar., 716

[4] Bakker, "Professional competence and the classification and selection of pupils for schools for “feebleminded” children in the Netherlands (1900–1940).", 729-730

[5] Ibidem

[6] Idem, 730-731

[7] Bolaños-Medina and González-Ruiz, "Deconstructing the Translation of Psychological Tests.", 716-717

[8] Ibidem

[9] Fedor De Beer, "Dr. D. Herderschêe en het bepalen van wezenlijke achterlijkheid," Tijdschrift voor Orthopedagogiek 51 (2012)., 15

[10] Ernst Mulder and Frieda Heyting, "The Dutch curve: The introduction and reception of intelligence testing in the Netherlands, 1908-1940," Journal of the History of the Behavioral Sciences 34, no. 4 (1998), https://doi.org/10.1002/(SICI)1520-6696(199823)34:4<349::AID-JHBS1>3.0.CO;2-M, http://dx.doi.org/10.1002/(SICI)1520-6696(199823)34:4<349::AID-JHBS1>3.0.CO;2-M., 354

[11] Idem, 356

[12] Ibidem

[13] Idem, 360

[14] Idem, 362

[15] Bakker, "Professional competence and the classification and selection of pupils for schools for “feebleminded” children in the Netherlands (1900–1940).", 742

[16] De Beer, "Dr. D. Herderschêe en het bepalen van wezenlijke achterlijkheid.", 14

[17] Jan Brandsma, "Strijdmakkers : ontstaan, groei en professionalisering van het Buitengewoon Onderwijs in Nederland, ca. 1895-1950" (University of Groningen, 2022)., 31

[18] Idem, 35-37

Vitrine 2: Het kwaad doorgronden

Wat vertellen testen ons?

Psychologische testen uit de twintigste eeuw vertellen ons niet alleen iets over individuen, maar vooral over de manier waarop samenlevingen mensen wilden meten, begrijpen en beoordelen. Testen zijn nooit neutrale instrumenten. Zij zijn ingebed in historische contexten, ideologische overtuigingen en institutionele praktijken.[1] In de twintigste eeuw, een periode gekenmerkt door oorlog, totalitarisme en massale bureaucratisering, groeide het vertrouwen in wetenschappelijke methoden om het menselijke karakter te objectiveren.[2] Psychologische testen boden de belofte dat persoonlijkheid, intelligentie en zelfs morele gezindheid meetbaar en classificeerbaar waren. In die zin onthullen testen niet alleen iets over degenen die getest werden, maar ook over het mensbeeld van de samenleving die deze testen ontwikkelde. Testen weerspiegelen de behoefte om de negatieve kanten van de mens niet enkel juridisch te beoordelen, maar ook psychologisch te begrijpen en te verklaren.[3] Ze suggereren dat achter daden verborgen persoonlijkheidseigenschappen schuilgaan die blootgelegd kunnen worden. Daarmee dragen psychologische testen bij aan een mensbeeld waarin de mens wordt opgevat als een psychologisch te doorgronden wezen met een meetbare innerlijke kern. De Neurenbergprocessen vormen een cruciale historische casus waarin deze ontwikkelingen samenkomen.[4]

Testen in Neurenberg: het meten van het kwaad

Tijdens de Neurenbergprocessen (1945–1946) werden verschillende hooggeplaatste nazi’s onderworpen aan psychologische en psychiatrische testen.[5] De vraag was niet alleen of zij juridisch schuldig waren, maar ook: wat voor mensen waren zij? Waren zij krankzinnig, sadistisch, moreel defect of ‘normaal’? Onder leiding van onder meer psycholoog Gustave Gilbert en psychiater Douglas Kelley werden IQ-testen, persoonlijkheidstesten en projectietesten afgenomen.[6] De uitkomsten waren ontregelend: veel van de beklaagden scoorden gemiddeld of zelfs bovengemiddeld op intelligentie en er was geen bewijsvan krankzinnigheid dat hun daden kon verklaren.[7] Dit ondermijnde het idee dat gruwelijke, onmenselijke daden het product zijn van pathologie.[8] Psychologische testen werden ingezet als instrument voor moreel onderzoek.[9] Niet om schuld vast te stellen, dat is de taak van de rechtbank, maar om inzicht te krijgen in de psychologische constitutie van daders van extreemgeweld. Testen functioneerden zo op het snijvlak van wetenschap en moraal: zij probeerden het onbegrijpelijke begrijpelijk te maken.

Projectietesten: toegang tot het onbewuste

In deze context kregen projectietesten bijzondere betekenis. Projectietesten zijn gebaseerd op het psychoanalytische idee dat mensen hun onbewuste drijfveren projecteren op ambigue stimuli.[10] Door respondenten bijvoorbeeld inktvlekken of foto’s te laten interpreteren, zou men toegang krijgen tot diepere lagen van hun persoonlijkheid. De Rorschachtest, ontwikkeld door Hermann Rorschach (1884 – 1922), bestaat uit tien inktvlekplaten.[11] De interpretaties die proefpersonen geven worden geanalyseerd op structuur, emotionele toon en symboliek. Tijdens en na de Neurenbergprocessen werd deze test gebruikt om inzicht te krijgen in de persoonlijkheidsstructuur van nazi-leiders.[12] De hoop was dat afwijkende of psychopathologische patronen zichtbaar zouden worden in hun antwoorden. Projectietesten werden bij uitstek geschikt geacht voor dit doel, omdat zij, in tegenstelling tot directe ondervraging, verondersteld werden via het onderbewuste te werken en daardoor minder vatbaar zouden zijn voor sociaal wenselijke antwoorden van verdachten. Opmerkelijk was dat testresultaten van veel nazi-leiders geen extreme afwijkingen toonden.[13] Dit voedde de latere discussie over de ‘banaliteit van het kwaad’ (Hannah Arendt): het idee dat daders van grootschalige misdaden niet noodzakelijk demonisch of krankzinnig zijn, maar gewone mensen die bevelen opvolgen zonder kritische reflectie.[14]

Szondi-test

De Szondi-test, ontwikkeld door Leopold Szondi (1893-1986), is een minder bekende maar invloedrijke projectietest.[15] Testpersonen krijgen reeksen foto’s van psychiatrische patiënten te zien en moeten aangeven welke gezichten hen aantrekken of afstoten. Volgens Szondi projecteren zij hiermee hun eigen verdrongen neigingen en drijfveren. Een beroemde toepassing van de test vond plaats tijdens het proces tegen de hooggeplaatste SS-officier Adolf Eichmann in Jeruzalem in 1961.[16] Eichmann werd beschouwd als één van de hoofdverantwoordelijken voor de logistieke organisatie van de Holocaust. De resultaten van Eichmann op de Szondi test zijn naar de testontwikkelaar Szondi zelf gestuurd[17] en die concludeerde het volgende: Eichmann had a strong sadomasochistic syndrome, an insatiable drive for power, and intense homicidal impulses: ‘This man is a criminal with an insatiable intention to kill [. . .]. Het is echter wel goed op te merken dat Szondi zelf joods was en hoewel de resultaten naar hem werden opgestuurd zonder erbij te vermelden dat om Eichmann ging, sluit Bergstein niet uit het dat hij het wel geweten heeft dat het om Eichmann ging.[18] Deze noot van kritiek sluit aan bij analyses die Eichmann niet als monster, maar eerder als radertje in een systeem beschouwden. De Szondi-test illustreert de menselijke behoefte om te begrijpen hoe individuen tot gruwelijke daden in staat zijn, evenals het geloof dat ‘het kwaad’ in het onderbewustzijn verankerd ligt en via projectie kan worden blootgelegd. Hoewel de Szondi-test vandaag de dag nauwelijks meer gebruikt wordt, is er in 2019 nog een Belgisch onderzoek verschenen waarin 431 gevangen onderworpen werden aan de test.[19] Het doel van dat onderzoek was verbanden leggen tussen de belangrijkste variabelen en het effect van leeftijd, geslacht en juridische status daarop.

Testen als instrument in de rechtbank

De inzet van psychologische testen in juridische contexten roept fundamentele vragen op. In de rechtszaal draait het om verantwoordelijkheid, toerekeningsvatbaarheid en intentie. Psychologische testen beloven inzicht in innerlijke dispositie, maar zij opereren binnen een probabilistisch en interpretatief kader. Tijdens de Neurenbergprocessen hadden testen geen doorslaggevende juridische status. Ze fungeerden eerder als aanvullend, diagnostischinstrument: ze werden ingezet om te beoordelen of iemand geestelijk ziek was, maar niet of iemand l schuldig was. Toch hadden zij symbolische waarde. Ze gaven uitdrukking aan de behoefte om het ‘kwaad’ in de mens te begrijpen. In hedendaagse rechtspraktijken worden psychologische testen – en ook projectietesten – nog steeds gebruikt, bijvoorbeeld bij forensisch psychiatrisch onderzoek naar toerekeningsvatbaarheid of risicotaxatie. Projectietesten zoals de Rorschachtest worden echter kritischer benaderd vanwege vragen rond betrouwbaarheid en validiteit.[20] De rechtbank vraagt om objectiviteit en reproduceerbaarheid, terwijl projectietesten sterk afhankelijk zijn van interpretatie.

Een reflectieve blik: betekenis toen en nu

Met een reflectieve bril laten de projectietesten die zijn ingezet tijdens de Neurenbergprocessenzien hoe sterk men in de twintigste eeuw geloofde in psychologische doorgrondbaarheid. Men zocht naar onderbewuste die het kwaad kon verklaren. Wat betekenen psychologische testen vandaag in de rechtbank? Ze medicaliseren gedrag door misdaad te koppelen aan persoonlijkheidsstructuur of stoornis. Ook individualiseren ze verantwoordelijkheid, zelfs wanneer misdaden collectief of systemisch zijn. Daarnaast suggereren testen dat 'moraliteit' meetbaar is, alsof intentie en schuld psychologisch objectief vast te stellen zijn. Tegelijkertijd zijn ze ook een bescherming: zij kunnen aantonen dat iemand verminderd toerekeningsvatbaar is, of juist dat iemand bewust handelde. De geschiedenis van de inzet van projectietesten in de context van Neurenbergprocessen en bij Eichmanns proces in Jeruzalemconfronteert ons met een ongemakkelijke conclusie: het kwaad laat zich niet eenvoudig psychologisch isoleren. Testen onthullen evenveel over onze behoefte aan verklaring als over de geteste persoon zelf.

[1] Joel E. Dimsdale, "Use of Rorschach tests at the Nuremberg war crimes trial: A forgotten chapter in history of medicine," Journal of Psychosomatic Research 78, no. 6 (2015), https://doi.org/10.1016/j.jpsychores.2015.04.001, http://dx.doi.org/10.1016/j.jpsychores.2015.04.001., 518

[2] Alette Smeulers, "Een steekje los?:Over de geestesgesteldheid van daders van internationale misdrijven: van Neurenberg tot Den Haag," Smeulers, A 2015, 'Een steekje los? Over de geestesgesteldheid van daders van internationale misdrijven: van Neurenberg tot Den Haag', Ontmoetingen : Voordrachtenreeks van het Lutje Psychiatrisch-Juridisch Gezelschap, pp. 1-15. < http://www.lutjepjg.nl/publicaties > (2015). https://research.rug.nl/en/publications/4216126d-0943-4d8b-abe9-2bf103c0a6f2., 1-2

[3] Ibidem

[4] Dimsdale, "Use of Rorschach tests at the Nuremberg war crimes trial: A forgotten chapter in history of medicine.", 515-518

[5] Smeulers, "Een steekje los?:Over de geestesgesteldheid van daders van internationale misdrijven: van Neurenberg tot Den Haag.", 1-3

[6] Idem, 3-5

[7] Ibidem

[8] Ibidem

[9] Ibidem

[10] Dimsdale, "Use of Rorschach tests at the Nuremberg war crimes trial: A forgotten chapter in history of medicine.", 515-516

[11] Ibidem

[12] José Brunner, "Eichmann's Mind: Psychological, Philosophical, and Legal Perspectives," Theoretical Inquiries in Law 1, no. 2 (2001), https://doi.org/10.2202/1565-3404.1013, https://dx.doi.org/10.2202/1565-3404.1013., 8-10

[13] Ibidem

[14] Smeulers, "Een steekje los?:Over de geestesgesteldheid van daders van internationale misdrijven: van Neurenberg tot Den Haag.", 3-5

[15] Mary Bergstein, "Photography in the Szondi Test: ‘The Analysis of Fate’," History of Photography 41, no. 3 (2017), https://doi.org/10.1080/03087298.2017.1304625, https://dx.doi.org/10.1080/03087298.2017.1304625., 217-218

[16] Idem, 237

[17] Ibidem

[18] Ibidem

[19] Benjamin Thiry, "Norms for the Szondi Test on a prison sample," 39 (08/01 2020)., 1-2

[20] Igor Areh, Fanny Verkampt, and Alfred Allan, "Critical review of the use of the Rorschach in European courts," Psychiatry, Psychology and Law 29, no. 2 (2022), https://doi.org/10.1080/13218719.2021.1894260, https://dx.doi.org/10.1080/13218719.2021.1894260., 1-2

Vitrine 3: Meten zonder woorden

De SON-intelligentietest (1943) is een niet-verbale intelligentietest die wordt ingezet bij dove kinderen.[1] De test doet weinig beroep op taalvaardigheid, die bij dove kinderen vaak minder ontwikkeld is. Dit hangt samen met de onderwijspraktijk die tot in de jaren zestig dominant was. In het dovenonderwijs werd lange tijd de zogenoemde orale methode gebruikt: dove kinderen moesten leren spreken en liplezen en het gebruik van gebarentaal werd ontmoedigd of zelfs verboden. Hierdoor kregen veel kinderen slechts beperkt toegang tot een volwaardige taal in hun vroege ontwikkeling, wat negatieve gevolgen kon hebben voor hun taalontwikkeling en schoolprestaties.[2] Een test die zo min mogelijk afhankelijk is van gesproken taal maakt het daarom mogelijk hun cognitieve vermogens betrouwbaarder te beoordelen. Naast de mentale leeftijd meet de SON-intelligentietest ook de mate van abstract denken, evenals kenmerken van het karakter en gedrag van het kind tijdens het onderzoek.[3] De achterliggende gedachte is dat een kind geen recht wordt gedaan wanneer het uitsluitend wordt beoordeeld op basis van een numerieke testscores. De observaties van de onderzoeker tijdens het uitvoeren van de opdrachten, bijvoorbeeld hoe een kind problemen aanpakt, reageert op feedback en omgaat met moeilijkheden, leveren aanvullende informatie op over het cognitieve functioneren en de leerstijl van het kind.[4]

De eerste versie van de SON-intelligentietest wordt in 1943 ontwikkeld door Nan Oomen, die als psychologe werkzaam was aan het Instituut voor Doven in Sint-Michielsgestel.[5] In 1958 brengen zij en haar echtgenoot Jan Snijders, hoogleraar psychologie aan de Rijksuniversiteit Groningen, een eerste herziening van de test uit. Een belangrijke aanpassing is dat de test wordt genormeerd voor zowel horende als dove kinderen. Daardoor kunnen de prestaties van dove kinderen beter worden vergeleken met die van leeftijdsgenoten in het algemeen. In latere jaren wordt de test verder doorontwikkeld tot een reeks moderne versies, zoals de SON-R-tests, die volledig of grotendeels zonder gesproken instructies kunnen worden afgenomen en daardoor geschikt zijn voor mensen met beperkte taalvaardigheid of een andere moedertaal dan die van de testleider.[6]

Een belangrijk kenmerk van latere versies van de SON-R is dat de test gebruikmaakt van visuele en praktische opdrachten, zoals patroonleggen, analogieën of ruimtelijke puzzels.[7] De instructies kunnen met natuurlijke gebaren worden gegeven en de testleider geeft tijdens de afname feedback over juiste of onjuiste antwoorden.[8] Bovendien worden de items vaak adaptief aangeboden: afhankelijk van het prestatieniveau van het kind krijgt het meer of minder moeilijke opdrachten. Zo kan binnen relatief korte tijd een betrouwbaar beeld van het algemene intelligentieniveau worden verkregen. Onderzoek laat zien dat moderne varianten van de SON-R een valide instrument vormen om cognitieve vermogens te meten en dat de test ook een redelijke voorspeller kan zijn van latere schoolprestaties, bijvoorbeeld in vakken als rekenen.[9] Dit bevestigt dat een niet-verbale intelligentietest een waardevol alternatief kan zijn voor traditionele tests die sterk op taal zijn gebaseerd.

De SON-intelligentietest illustreert de veranderende maatschappelijke opvattingen in de twintigste eeuw over kinderen met een beperking. In de jaren vijftig groeit het besef dat deze kinderen niet alleen verzorgd moeten worden, maar ook recht hebben op onderwijs en ontwikkeling op hun eigen niveau.[10] Tegelijk sluit de test aan bij het toenemende streven naar gelijke kansen in het onderwijs. Kinderen mogen niet worden beoordeeld op factoren die weinig met intelligentie te maken hebben, zoals taalachterstand, culturele achtergrond of een gehoorbeperking.[11] Door het gebruik van een niet-verbale test konden psychologen en pedagogen een eerlijker beeld krijgen van de cognitieve mogelijkheden van dove kinderen.

Voor dove kinderen betekende de SON-intelligentietest daarom een belangrijke stap richting erkenning van hun intellectuele capaciteiten en betere ontwikkelingskansen. De test maakte zichtbaar dat een taalachterstand niet automatisch gelijkstaat aan een lagere intelligentie. Daarmee leverde de SON-test niet alleen een bijdrage aan de psychologische diagnostiek, maar ook aan een bredere verandering in hoe men keek naar onderwijs, ontwikkelingsmogelijkheden en inclusie van kinderen met een beperking.

[1] Marjolijn Winkel and Peter J. Tellegen, "Intelligentietests voor jonge kinderen: deson-r2½-7 en andere intelligentietests," Kind en adolescent 22, no. 3 (2001), https://doi.org/10.1007/BF03060809, http://dx.doi.org/10.1007/BF03060809., 93

[2] Tom Humphries et al., "Avoiding Linguistic Neglect of Deaf Children," Social Service Review 90, no. 4 (2016), https://doi.org/10.1086/689543, http://dx.doi.org/10.1086/689543., 594

[3] Winkel and Tellegen, "Intelligentietests voor jonge kinderen: deson-r2½-7 en andere intelligentietests.", 95

[4] Francien Geerds, "De SON-R 6-40: een niet-verbale intelligentietest," Neuropraxis 19, no. 6 (2015), https://doi.org/10.1007/s12474-015-0104-1, http://dx.doi.org/10.1007/s12474-015-0104-1., 163-164

[5] Peter van Drunen and Henk Jan Conradi, Bezielde wetenschap : een halve eeuw Nederlandse psychologie in vijf portretten (Assen: Van Gorcum, 1998).

[6] Geerds, "De SON-R 6-40: een niet-verbale intelligentietest.", 163-164

[7] Idem, 164-165

[8] Ibidem

[9] Jasmin T. Gygi et al., "The Predictive Validity of Four Intelligence Tests for School Grades: A Small Sample Longitudinal Study," Frontiers in psychology 8 (2017), https://doi.org/10.3389/fpsyg.2017.00375, https://doi.org/10.3389/fpsyg.2017.00375., 1-2

[10] Humphries et al., "Avoiding Linguistic Neglect of Deaf Children.", 594-595

[11] Ibidem

Vitrine 4: Gelijke kansen of een oneerlijke selectie?

Aan het begin van de twintigste eeuw speelde testen in het Nederlandse onderwijs een bescheiden en selectieve rol.[1] Testen werden niet standaard afgenomen bij alle leerlingen, maar waren vooral bedoeld voor kinderen die opvielen door leerproblemen of juist uitzonderlijke prestaties. Metingen dienden voornamelijk als diagnostisch hulpmiddel: ze ondersteunden beslissingen over plaatsing in het bijzonder onderwijs en waren sterk verbonden met zorg en begeleiding. Van grootschalige selectie op basis van testen was nog geen sprake. Deze situatie veranderde ingrijpend in de tweede helft van de twintigste eeuw met de introductie van de Citotoets. In 1968 werd de Mammoetwet ingevoerd in Nederland.[2] De onderwijstypes mulo, mms en hbs werden afgeschaft en vervangen door de mavo, wat later vmbo is geworden, havo en vwo. Naar Amerikaans voorbeeld werd een gestandaardiseerde eindtoets ontwikkeld onder leiding van hoogleraar toegepaste psychologie A.D. de Groot (1914-2006).[3] Een gestandaardiseerde eindtoets was nodig, omdat er behoefte was aan een landelijke selectiemethode voor doorstroom naar het voorgezet onderwijs. De Citotoets, sinds 2023 de doorstroomtoets, bestond uit meerkeuzevragen over taal, rekenen en algemene kennis.[4] Zij werd gepresenteerd als een middel om gelijke kansen te bevorderen bij de overgang naar het voortgezet onderwijs en als een eerlijker alternatief voor het oordeel van leerkrachten. Met de invoering van de Citotoets, werd testen een nationale praktijk. Niet langer alleen ‘bijzondere’ leerlingen, maar alle kinderen werdenaan het eind van de basisschool getoetst.[5]

Vaak wordt gedacht dat vrijwel elk land een vergelijkbare eindtoets kent, maar dat is niet het geval. Duitsland selecteert al rond het elfde levensjaar, maar zonder nationale eindtoets.[6] Eerdere schoolprestaties zijn daar bepalend. In Frankrijk en Engeland vindt selectie doorgaans pas rond het vijftiende jaar plaats. Alleen een kleine groep Engelse leerlingen doet op elfjarige leeftijd toelatingsexamen voor een grammar school, vergelijkbaar met het Nederlandse gymnasium.[7] In deze internationale vergelijking valt op dat Nederland leerlingen al rond hun elfde jaar via een landelijke, gestandaardiseerde toets over verschillende onderwijsniveaus verdeelt.

Al vanaf de invoering in 1970 riep deze nationale toetsmaatschappelijke discussie op. Krantenartikelen uit de jaren zestig en zeventig laten zien dat er aanzienlijke kritiek bestond op de Citotoets, met name op het gebruik van meerkeuzevragen.[8] Tegenstanders stelden dat meerkeuzevragen gokken in de hand werkten en dat leerlingen met een goede teststrategie soms beter scoorden dan leerlingen met meer inzicht. Daarmee zou de toets eerder taalvaardigheid dan daadwerkelijke kennis en begrip meten. Voorstanders benadrukten daarentegen dat juist de vaste structuur en standaardisering van meerkeuzevragen een vergelijking tussen leerlingen mogelijk maakte.[9] Deze spanning tussen betrouwbaarheid en betekenisvolle meting vormt tot op de dag van vandaag een kernpunt in het debat over nationale toetsing.

In de loop der jaren groeide de Citotoets uit tot een belangrijk instrument voor selectie en doorstroom binnen het Nederlandse onderwijssysteem.[10] De toets kreeg een centrale positie bij het schooladvies en daarmee bij de verdeling van leerlingen over vmbo, havo en vwo. Onderzoekers hebben laten zien dat deze vroege selectie grote gevolgen heeft voor schoolloopbanen en latere maatschappelijke kansen. De school wordt in dit verband wel omschreven als een ‘sorteermachine’[11], waarin toetsscores bijdragen aan een relatief vaste verdeling van leerlingen over onderwijsniveaus. Tegelijkertijd wijzen recente studies erop dat deze selectiemechanismen kansenongelijkheid kunnen versterken, vooral wanneer toetsscores onvoldoende rekening houden met leerpotentieel en sociale achtergrond.[12]

Naast de veranderende functie van toetsen veranderde ook hun vorm. Waar toetsen aanvankelijk in koffers werden aangeleverd en uitsluitend op papier werden afgenomen, verschenen gaandeweg nieuwe toetsvormen. Luistertoetsen maakten het mogelijk om taalvaardigheid breder te meten dan alleen via schriftelijke opdrachten of juist om kinderen die laag scoren op een toets, door bijvoorbeeld dyslexie, de kans te geven om beter op een toetst te scoren. Later volgde de digitalisering van toetsen, waardoor afname efficiënter werd en resultaten sneller en gedetailleerder konden worden geanalyseerd. Digitale toetsen en leerlingvolgsystemen maakten het bovendien mogelijk om leerlingen al vanaf jonge leeftijd structureel te volgen, wat de rol van toetsing in onderwijsbeslissingen verder vergrootte.

Tot slot is het van belang dat deze toetsen niet alleen betekenis hebben voor de onderwijspraktijk, maar ook voor historisch en wetenschappelijk onderzoek. Het ADNG bewaart schooltoetsen, psychologische testen, opgaven, handleidingen en begeleidende documenten. Deze materialen zijn toegankelijk voor studenten en onderzoekers en bieden inzicht in de ontwikkeling van toetsing, selectie en beleidskeuzes in het Nederlandse onderwijs. Daarmee laten zij zien hoe een instrument dat begon als middel voor objectieve meting, uitgroeide tot een bepalende factor in de levensloop van vrijwel ieder schoolkind.

[1] Bakker, "Professional competence and the classification and selection of pupils for schools for “feebleminded” children in the Netherlands (1900–1940).", 728-729

[2] Karen Heij, "Van de kat en de bel: Tellen en vertellen met de eindtoets basisonderwijs" (2021), https://research.tilburguniversity.edu/en/publications/5eb16782-c25c-4c0c-a657-f740174f50bb., 121

[3] Idem, 134

[4] S. Scheider et al., "Educational inequality due to lack of validity: A methodological critique of the Dutch school system," International Journal of Educational Research 117 (2023), https://doi.org/10.1016/j.ijer.2022.102097, http://dx.doi.org/10.1016/j.ijer.2022.102097., 14

[5] Heij, "Van de kat en de bel: Tellen en vertellen met de eindtoets basisonderwijs.", 36

[6] Idem, 60

[7] Idem, 230

[8] Idem, 93

[9] Idem, 285

[10] J. Terwel, "Terwel, J. (2006). Is de school een sorteermachine? Schoolkeuze en schoollloopbaan van leerlingen van 10-16 jaar," Amsterdam : Vrije Universiteit Amsterdam, (2006), 57 pp. (2006). https://research.vu.nl/en/publications/974be733-aaef-41a1-8a1f-d8fe0c2714ff., 7

[11] Idem, 4

[12] Scheider et al., "Educational inequality due to lack of validity: A methodological critique of the Dutch school system.", 10

Referenties

Areh, Igor, Fanny Verkampt, and Alfred Allan. "Critical Review of the Use of the Rorschach in European Courts." Psychiatry, Psychology and Law 29, no. 2 (2022): 183-205. https://doi.org/10.1080/13218719.2021.1894260. https://dx.doi.org/10.1080/13218719.2021.1894260.

Bakker, Nelleke. "Professional Competence and the Classification and Selection of Pupils for Schools for “Feebleminded” Children in the Netherlands (1900–1940)." Paedagogica Historica 57, no. 6 (2021): 728-44. https://doi.org/10.1080/00309230.2020.1762681. https://dx.doi.org/10.1080/00309230.2020.1762681.

Bergstein, Mary. "Photography in the Szondi Test: ‘The Analysis of Fate’." History of Photography 41, no. 3 (2017): 217-40. https://doi.org/10.1080/03087298.2017.1304625. https://dx.doi.org/10.1080/03087298.2017.1304625.

Bolaños-Medina, Alicia, and Víctor González-Ruiz. "Deconstructing the Translation of Psychological Tests." Meta 57, no. 3. (2012): 715-39. https://doi.org/10.7202/1017088ar. http://dx.doi.org/10.7202/1017088ar.

Brandsma, Jan. "Strijdmakkers : Ontstaan, Groei En Professionalisering Van Het Buitengewoon Onderwijs in Nederland, Ca. 1895-1950." University of Groningen, 2022.

Brunner, José. "Eichmann's Mind: Psychological, Philosophical, and Legal Perspectives." Theoretical Inquiries in Law 1, no. 2 (2001). https://doi.org/10.2202/1565-3404.1013. https://dx.doi.org/10.2202/1565-3404.1013.

De Beer, Fedor. "Dr. D. Herderschêe En Het Bepalen Van Wezenlijke Achterlijkheid." Tijdschrift voor Orthopedagogiek 51 (2012): 13-23.

Dimsdale, Joel E. "Use of Rorschach Tests at the Nuremberg War Crimes Trial: A Forgotten Chapter in History of Medicine." Journal of Psychosomatic Research 78, no. 6 (2015): 515-18. https://doi.org/10.1016/j.jpsychores.2015.04.001. http://dx.doi.org/10.1016/j.jpsychores.2015.04.001.

Drunen, Peter van, and Henk Jan Conradi. Bezielde Wetenschap : Een Halve Eeuw Nederlandse Psychologie in Vijf Portretten. Assen: Van Gorcum, 1998.

Geerds, Francien. "De Son-R 6-40: Een Niet-Verbale Intelligentietest." Neuropraxis 19, no. 6 (2015): 163-66. https://doi.org/10.1007/s12474-015-0104-1. http://dx.doi.org/10.1007/s12474-015-0104-1.

Gygi, Jasmin T., Priska Hagmann-von Arx, Florine Schweizer, and Alexander Grob. "The Predictive Validity of Four Intelligence Tests for School Grades: A Small Sample Longitudinal Study." Frontiers in psychology 8 (2017): 375. https://doi.org/10.3389/fpsyg.2017.00375. https://doi.org/10.3389/fpsyg.2017.00375.

Heij, Karen. "Van De Kat En De Bel: Tellen En Vertellen Met De Eindtoets Basisonderwijs." 2021. https://research.tilburguniversity.edu/en/publications/5eb16782-c25c-4c0c-a657-f740174f50bb.

Humphries, Tom, Poorna Kushalnagar, Gaurav Mathur, Donna Jo Napoli, Carol Padden, Christian Rathmann, and Scott Smith. "Avoiding Linguistic Neglect of Deaf Children." Social Service Review 90, no. 4 (2016): 589-619. https://doi.org/10.1086/689543. http://dx.doi.org/10.1086/689543.

Mulder, Ernst, and Frieda Heyting. "The Dutch Curve: The Introduction and Reception of Intelligence Testing in the Netherlands, 1908-1940." Journal of the History of the Behavioral Sciences 34, no. 4 (1998): 349-66 .https://onlinelibrary.wiley.com/doi/10.1002/(SICI)1520-6696(199823)34:4%3C349::AID-JHBS1%3E3.0.CO;2-M .

Scheider, S., S. Rosenfeld, S. Bink, and N. Lecina. "Educational Inequality Due to Lack of Validity: A Methodological Critique of the Dutch School System." International Journal of Educational Research 117 (2023). https://doi.org/10.1016/j.ijer.2022.102097. http://dx.doi.org/10.1016/j.ijer.2022.102097.

Smeulers, Alette. "Een Steekje Los?:Over De Geestesgesteldheid Van Daders Van Internationale Misdrijven: Van Neurenberg Tot Den Haag." Smeulers, A 2015, 'Een steekje los? Over de geestesgesteldheid van daders van internationale misdrijven: van Neurenberg tot Den Haag', Ontmoetingen : Voordrachtenreeks van het Lutje Psychiatrisch-Juridisch Gezelschap, pp. 1-15. < http://www.lutjepjg.nl/publicaties >. (2015). https://research.rug.nl/en/publications/4216126d-0943-4d8b-abe9-2bf103c0a6f2.

Terwel, J. "Terwel, J. (2006). Is De School Een Sorteermachine? Schoolkeuze En Schoollloopbaan Van Leerlingen Van 10-16 Jaar." Amsterdam : Vrije Universiteit Amsterdam, (2006), 57 pp. (2006). https://research.vu.nl/en/publications/974be733-aaef-41a1-8a1f-d8fe0c2714ff.

Thiry, Benjamin. "Norms for the Szondi Test on a Prison Sample." 39 (08/01 2020): 76-91.

Winkel, Marjolijn, and Peter J. Tellegen. "Intelligentietests Voor Jonge Kinderen: Deson-R2½-7 En Andere Intelligentietests." Kind en adolescent 22, no. 3 (2001): 93-99. https://doi.org/10.1007/BF03060809. http://dx.doi.org/10.1007/BF03060809.

Opening tentoonstelling Geschiedenis van testen

De tentoonstelling laat zien dat testen geen objectieve meetinstrumenten waren maar als producten van hun tijd maatschappelijke opvattingen en psychologische theorieën weerspiegelen.

Laatst gewijzigd:01 april 2026 13:39

View this page in: English

Tentoonstelling: Geschiedenis van testen

Vitrine 1: Intelligentie wordt meetbaar

Vitrine 2: Het kwaad doorgronden

Vitrine 3: Meten zonder woorden

Vitrine 4: Gelijke kansen of een oneerlijke selectie?

Referenties

Functioneel

Standaard

Volledig