Eigenlijk was ik van plan een stukje te schrijven over het feit dat ik niet heel oud ga worden. Ik ben namelijk linkshandig en linkshandigen schijnen zo’n 7 jaar jonger te sterven. Plus, mijn achternaam begint met een letter die achterin het alfabet zit en dat schijnt ook weer enkele jaren van je leven te kosten. Gelukkig ben ik wel getrouwd want anders kon ik echt mijn dagen gaan tellen. Singles sterven immers jonger dan gehuwden. Wat interessant allemaal, dacht ik, en ik besloot eens iets op te zoeken over deze onderzoeken.

Als onderzoeker wil je vast niet zomaar hele bevolkingsgroepen informeren over hun aanzienlijk verkorte levensduur, zou je denken. Dus doe je grondige studies voordat je dit soort claims wereldkundig maakt. Nou, dat blijkt toch best een beetje tegen te vallen. Eigenlijk zijn de meeste van dit soort studies puur gebaseerd op statistiek. In het huidige computertijdperk hebben we namelijk allemaal beschikking over grote datasets en daar kunnen we vervolgens hartstikke mooie statistiek op uit voeren. De interpretatie van die statistiek laat echter nog al eens te wensen over. Bij een correlatie wordt zo vaak gesproken van een significante correlatie, waarmee wordt geïmpliceerd dat er een verband is tussen bepaalde factoren. Dit is echter nogal bedrieglijk. Hoe groter je dataset, hoe groter de kans dat je allerlei significante correlaties in je data aantreft. Ik heb net zelf correlaties bekeken van een onnoemelijk grote dataset en die waren allemaal significant. Echter, ze waren heus niet allemaal relevant! Een beter getal om hier te gebruiken is correlatiecoëfficiënt, die geeft de mate aan waarin twee variabelen samenhangen. Deze kan laag zijn maar toch significant, zoals het geval is bij een deel van mijn data. Dit wil dan zeggen dat het gevonden verband tussen twee factoren aannemelijk is, maar van weinig belang.

Daarnaast worden regelmatig zaken met elkaar gecorreleerd die niets met elkaar te maken hebben. Een goed voorbeeld is dat als je een data set zou hebben die bestaat uit het aantal geconsumeerde ijsjes per vrouw en het feit of zij een rok of een broek draagt, je een positief verband zult vinden tussen het eten van ijsjes en het dragen van rokjes. De factor die hier ontbreekt is temperatuur. Beide factoren zijn (misschien?) gecorreleerd aan temperatuur maar niet aan elkaar. Bij de singlestudie dringt eenzelfde soort beeld zich op. Hoewel de onderzoekers wel corrigeren voor leeftijd en levenswijze blijft de vraag of de grotere sterftekans van singles werkelijk te maken heeft met het single zijn. De oorzaak van de jonge sterfte kan namelijk niet het ‘single-zijn’ zijn, maar is iets wat daaruit volgt. Bijvoorbeeld dat singles ongelukkiger zijn, of meer last hebben van stress. Als dat zo is dan is het ‘single-zijn’ dus niet de oorzaak van de grotere sterftekans. Dat mensen die veel stress hebben een hogere sterftekans hebben klinkt dan weer niet zo wereldschokkend, toch?

Het lijkt zo voor de hand liggend, maar toch haalt dit soort onderzoek elke keer weer de voorpagina. Bij het linkshandigen onderzoek blijkt er iets anders in het spel te zijn. Er lijkt in dit onderzoek niet gecorrigeerd voor leeftijd. Het wordt glashelder uitgelegd in deze leuke rubriek: Kul of kennis. Ook al kul, kennelijk. Hoef ik me daarover weer geen zorgen te maken en dat scheelt weer stress.