pluim_voor_overheidVanochtend is Lucia de B., de verpleegster die in 2003 veroordeeld werd voor moord op zeven en poging tot moord op drie van haar patiënten, definitief vrijgesproken. Zij is de laatste tijd regelmatig in het nieuws geweest omdat er fouten zouden zijn gemaakt in het oorspronkelijke proces. Voor wiskundigen is haar zaak bijzonder interessant omdat de bewijsvoering voor een deel gebaseerd zou zijn op een discutabele statistische berekening.

Destijds berekende statisticus Henk Elffers de indrukwekkend kleine kans van 1 op 342 miljoen dat één verpleegkundige bij alle 10 incidenten aanwezig zou zijn. Dit riep veel discussie op onder Nederlandse wiskundigen. Statistici wierpen zich op deze berekening en kwamen met heel andere getallen op de proppen, waaronder zelfs een kans van 1 op 9. Maar volgens de rechtbank heeft statistiek geen rol gespeeld in de uiteindelijke veroordeling. In het arrest staat echter letterlijk het volgende: “er is geen enkele aannemelijke verklaring gevonden voor het feit dat de verdachte in die korte periode bij zoveel overlijdensgevallen en levensbedreigende incidenten betrokken was” (paragraaf 11). Impliciet wordt hier gebruikt dat het aantal sterfgevallen en incidenten buitengewoon hoog was voor één verpleegkundige: statistiek.

Verschillende media (bijvoorbeeld de NRC) concluderen naar aanleiding van uitspraken van wiskundigen dat de statistische berekening van Elffers onjuist was. Die gebruikte voor de berekeningen een vrij elementaire methode, die we van de middelbare school nog kennen als het vaas-met-knikkers-model. In het begin werd De B. nog verdacht van 9 incidenten (moord of poging tot moord), zodat de oorspronkelijke berekening ongeveer als volgt ging: er waren in totaal 1029 diensten in de betreffende periode (neem een vaas met 1029 knikkers), tijdens 9 daarvan vond er een incident plaats (9 knikkers in de vaas zijn rood, de overige 1020 zijn zwart), en Lucia de B. draaide 142 diensten. Trek dus 142 knikkers uit de vaas, wat is de kans dat je alle 9 zwarte knikkers trekt?

Zo’n berekening is in principe niet onjuist. De vraag is echter of hij relevant is in deze context. Wanneer een statisticus zo’n getal berekent moet hij in de eerste plaats de werkelijkheid modelleren, en reduceren tot een behapbaar probleem. In dit geval betekent dat dat er slechts naar een beperkte tijdsperiode gekeken wordt, en naar een selecte groep verpleegsters. In het artikel On the (ab)use of statistics in the legal case against the nurse Lucia de B. (Law, Probability and Risk doi: 10.1093/lpr/mgm003 (2007)) gaven Ronald Meester en mede-auteurs een verhelderend voorbeeld. Stel dat iemand woonachtig in de DaCostastraat in Leiden de loterij wint. De kans dat juist deze persoon de loterij wint is erg klein, wat echter niet betekent dat het niet kan gebeuren. De kans dat iemand in de DaCostastraat wint, is echter weer een ander getal, evenals de kans dat iemand in Leiden of zelfs in heel Nederland wint. Kortom: het referentiekader maakt veel uit voor het getal dat uit de berekening komt, wat echter de gebruikte statistiek niet onjuist maakt. Bovendien: de kans is voor één persoon misschien klein, maar íemand in Nederland zal toch de loterij winnen.

Naast de beperking op de data, deed Elffers ook nog de volgende aannames:

  1. de kans dat er tijdens een dienst een incident plaatsvindt is gelijk voor alle verpleegkundigen
  2. de kans op een incident is steeds gelijk, onafhankelijk van het soort dienst (dag- of nachtdienst)

Deze aannames zijn erg generaliserend, het is immers best plausibel dat er juist tijdens een nachtdienst meer sterfgevallen zijn dan tijdens een dagdienst. Ook kan het zijn dat bepaalde verpleegkundigen juist de moeilijkere gevallen onder hun hoede krijgen. In Engeland maakte men in 1999 een vergelijkbare fout in het proces tegen Sally Clark, de moeder die werd verdacht van de moord op haar twee zoontjes. Deze zouden zijn overleden aan wiegendood. De berekening werd uitgevoerd door kinderarts Roy Meadow (?”The lawyers and the judge argued that it was not rocket science, so a statistical expert was not needed,” quote Nature). Meadow nam voor de kans dat een kind overlijdt aan wiegendood 1 op 8543, en kwadrateerde dit getal om tot de kans op twee gevallen van wiegendood in één gezin te komen: ongeveer 1 op 73 miljoen. Het ligt echter helemaal niet voor de hand dat wiegendood ongerelateerd is, bovendien sluit zo’n kleine kans ook niet uit dat het een gezin in Engeland eens overkomt dat twee zoons eraan overlijden.

In het geval van Lucia de B. steunde de statistische berekening sterk op de gebruikte aannames en modellering van de realiteit, wat leidt tot verschillende interpretaties. In elke toepassing van statistiek in de rechtzaal zal dit het geval zijn: het blijft (slechts) een vereenvoudiging van de werkelijkheid. De wiskundigen die in het hoger beroep getuigden waren diep verontwaardigd dat de rechter vroeg: “als jullie het dan niet eens zijn met Elffers’ getal, geef ons dan een beter getal” (Meester et al, 2007). Alsof er een absoluut beste interpretatie bestaat.

Uiteindelijk is Lucia de B. vrijgesproken omdat sterfgevallen niet ‘medisch onverklaarbaar’ waren, maar ‘medisch onverklaard gebleven’. Kortom: er was misschien niet eens sprake van moord.