conflictDe ontwikkeling van nieuwe media is razend snel. Waren we pakweg twintig jaar geleden nog onder de indruk van e-mail, zo worden we tegenwoordig met onze smartphones 24 uur per dag op de hoogte gehouden van het wel en wee van onze vrienden en publieke helden. Sites zoals Facebook and Hyves verbinden ons met elkaar en via Twitter laten we de hele wereld weten hoe we ons op het moment voelen. De opmars van 4 jaar Twitter lijkt niet meer te stoppen: in het eerste kwartaal van 2010 groeide het aantal tweets naar 4 miljard op de wereld. Voor de één is deze ontwikkeling een zegen, voor de ander een vloek. Wat u er ook van vindt, door de enorme hoeveelheid data die de tweets leveren lenen ze zich uitstekend voor wetenschappelijk onderzoek.

Tweets – korte berichtjes van maximaal 140 karakters – worden opgeslagen en zijn openbaar, en dus toegankelijk voor data analyse. Alan Mislove uit Boston heeft onderzocht welke woorden in de tweets veelvuldig worden gebruikt, en probeert daarmee de gemoedstoestand van de twitteraar te beoordelen.

Om de miljarden woorden te kunnen beoordelen is voor de analyse gebruik gemaakt van een puntensysteem dat door taaldeskundigen is ontwikkeld. Een woord als ‘gelukkig’ of ‘mooi’ scoort hoog op de lijst (6 punten), terwijl ‘bedrog’ of ‘gestolen’ juist heel laag in de puntenscore terug te vinden is (1 punt). Met behulp van dit puntensysteem bestudeerde Mislove hoe positief uitlatingen op verschillende tijdstippen van de dag zijn. Hij vergeleek ook de tweets in de loop van de week en bepaalde of de woonplaats van een twitteraar invloed heeft op zijn of haar berichtgeving. Al deze data werden in kaart gebracht (zie hier en hier)- en de analyse leidde tot interessante conclusies.

In de loop van de dag verschuift het woordgebruik in de tweets aanzienlijk. Zo lijkt de twitterende mens s’ochtends veel positiever dan ‘s avonds, en heeft hij of zij een dip rond lunchtijd. Ook door de week heen zijn er duidelijke verschillen te zien: mensen gebruiken positieve woorden het meest op de zondag. Dat neemt in de loop van de week af tot een dieptepunt op donderdagavond – en dit herstelt zich weer in de loop van het weekend.

Mislove vergeleek ook het taalgebruik van de oostkust van de VS met dat van de westkust. Twitteraars aan de westkust blijken veel meer positief getinte woorden te gebruiken dan hun vrienden aan de oostkust, en de middagdip is ook minder duidelijk meetbaar. Deze laatste vinding gebruikt Mislove als mediastunt: het verschillende woordgebruik laat volgens hem zien dat de mensen aan de westkust gelukkiger zijn dan aan de oostkust. Wat mij betreft is dit een ongeloofwaardige stelling – wie in de VS geweest is weet dat mensen aan de westkust veel liever positieve woorden gebruiken, en dat maakt ze niet per se gelukkiger. Mijn inziens zegt het gemeten verschil dus meer iets over de bestaande cultuurverschillen in taalgebruik- en dat is op zich al een mooie vinding. Om zijn stelling te bewijzen zou Mislove toch meer en grondiger onderzoek moeten verrichten.

Ondanks deze over-interpretatie van Mislove is de studie een mooi voorbeeld wat de mogelijkheden van het internet voor wetenschappelijk onderzoek zijn. De verzamelde data lenen zich voor vele leuke vraagstellingen. In de studie die ik hier beschrijf zou ik toch graag meer willen weten over de verschillen die in de loop van de week gevonden worden. Is het afhankelijk van geslacht en leeftijd? Wat is het netwerk (en dus ook interesse) van degenen die geen dieptepunten in hun taalgebruik beleven? In Nederland heeft het bedrijf Twirus onlangs in kaart gebracht wie nou eigenlijk de Nederlandse twitteraars zijn. Deze informatie kan ook gebruikt worden voor de interpretatie van Twitter-onderzoek.

Ook is het sociologisch gezien interessant wat voor een effect evenementen als de WK voetbal, of ingrijpende politieke beslissingen, als verkiezingen en kabinetsformaties hebben op het twittergedrag, en voornamelijk ook hoe lang bijvoorbeeld de euforie aanhoudt na het winnen van je favoriete partij danwel je eigen ploeg op de WK voetbal.
Taaldeskundigen kunnen de Twitterdata uitstekend gebruiken om lokale cultuurverschillen binnen landen of regio’s te bestuderen. Trends in de taal zullen op deze manier razendsnel opgepikt worden. Dit is natuurlijk ook commercieel gezien zeer interessant omdat men snel op trends in kan spelen.

Naast Twitter lenen ook andere moderne media zich uitstekend voor onderzoek. Het volgen van trefwoorden met ‘griep’ door Google bleek de griepgolf van 2008 zeer nauwkeurig weer te geven, deze meting was bovendien superieur in vergelijking tot de traditionele dataverzameling. Het internet kan dus een uitstekende graadmeter zijn voor veranderingen die in de maatschappij plaats hebben. Het enig lastige van deze studies is dat niet alle opleidingsniveaus en leeftijdsgroepen onder de gebruikers even goed gerepresenteerd zijn en dit generaliserende conclusies uitsluit.