Patroon

Een collega van me promoveerde onlangs op het gebruik van patroonherkenning om te beoordelen of iemand huidkanker heeft of een onschuldige moedervlek. De door hem ontwikkelde methode werkt erg goed en kan in sommige gevallen zelfs beter dan een specialist bepalen of een plekje daadwerkelijk gevaarlijk is. Toch zal altijd een arts beoordelen of er een behandeling nodig is, en zo ja, welke. Om zo’n beslissing te nemen, is context en kennis over het functioneren van de wereld nodig, dingen die een machine niet heeft. Een computerprogramma met echt begrip van de wereld is iets uit een sciencefictionverhaal: vooralsnog erg ver van de werkelijkheid.

 

Ook forensische experts gebruiken steeds vaker statistische methoden om tot een conclusie te komen over een juridisch vraagstuk. Er zijn bijvoorbeeld programma’s die het handschrift van een schrijver van een dreigbrief kunnen vergelijken met het handschrift van een verdachte. Uit een programma dat een statistische vergelijking doet komt een lijst van gelijkende handschriften, gesorteerd van meest naar minst gelijkend. Op basis van deze lijst zou de expert de conclusie kunnen trekken dat verdachte bovenaan de lijst de dreigbrief wel zal hebben geschreven. Deze conclusie kan echter nooit op basis van alleen de rangschikking getrokken worden.

 

Een arts of forensisch expert moet dus echt zijn eigen conclusies trekken en de algoritmische uitkomst slechts ter overweging meenemen. Daar zijn verschillende redenen voor. Ten eerste is de vergelijking hoogstwaarschijnlijk niet uitputtend: we kunnen alleen handschriften vergelijken met handschriften die bij ons bekend zijn. Als we dus een brief onderzoeken die geschreven is door iemand van wie we het handschrift niet kennen, zegt een heel slim programma hooguit dat hij het niet weet. De meeste programma’s zullen dat niet kunnen opmerken en slechts bekende handschriften laten zien als resultaat. Ten tweede is het statistische resultaat vaak maar een kleine factor in het grotere geheel. De rangschikking op zichzelf zegt weinig over de kans dat deze dader daadwerkelijk de dreigbrief heeft geschreven, maar doet alleen een uitspraak over dat de vorm van het handschrift in de dreigbrief lijkt op de vorm van het handschrift van een van de verdachten. Daarnaast is er veel context in een juridische zaak, zoals of de verdachte in staat was om de misdaad te plegen en of er een motief was. Sciencepalooza’s Charlotte doet onderzoek naar de rol van statistiek in rechtszaken, waarover zij al schreef in haar essay in “Nederland in ideeën” (zie ook “Hoe kansen in de rechtszaak terecht kwamen” in De Correspondent).

 

Zoals ik in de inleiding al beschreef hebben computers vooralsnog geen kennis en context buiten de applicatie waartoe ze zijn geprogrammeerd. Echter, kennis en context zijn belangrijk om in onze wereld te kunnen opereren zonder menselijke toezichthouder. Het zijn concepten die onder het bredere concept “begrip” vallen. Voor zelfstandig handelen zal de machine moeten begrijpen wat het doet. Een computer dat een algoritme uitvoert volgt echter alleen een soort recept of automatische methode, en heeft dus zeker geen echt begrip van de wereld. Er zijn filosofen, zoals Daniel Dennett, die ervan overtuigd zijn dat er voor competence niet noodzakelijk comprehension, oftewel begrip, nodig is, en dat een computer dus prima een taak kan uitvoeren zonder daar volledig begrip van te hebben. Persoonlijk ben ik ervan overtuigd dat wanneer context en achtergrondkennis (o.a. over hoe de wereld werkt) ontbreken, de machine altijd een supervisor nodig zal hebben om beslissingen te nemen in de echte wereld. Of machines ooit context en kennis van de wereld om ons heen zullen krijgen, en daarmee “begrip”, durf ik niet te voorspellen, maar vooralsnog lijkt dit in het algemeen een brug te ver.

 

In het geval van het patroonherkenningsalgoritme voor moedervlekken en de handschriftvergelijking moet steeds een mens achteraf een beslissing nemen. In vrijwel alle gevallen waarin de computer een taak geleerd wordt, worden er ook vooraf beslissingen genomen over hoe het algoritme aan relevante data komt. Zo moet de mens bijvoorbeeld aangeven waar bepaalde kennis naar refereert en of bepaalde kennis bij elkaar hoort. Koppeling van ruwe data naar de echte wereld is iets dat een computer niet kan (het zullen altijd nullen en enen blijven). Het leveren van input kost in de meeste gevallen veel tijd en moeite. De mens zal voorlopig dus een grote rol blijven spelen in “Big Data” en kunstmatige intelligentie. Naast het expliciet programmeren dus ook in het nemen van de uiteindelijke beslissing en de training. Het is aan de lezer of dat een geruststelling is of niet.