Verzamelzucht

Toen koning Shirham van Sissa een prachtig schaakspel had gekregen vroeg de koning hoe hij hem hiervoor kon belonen. Sissa antwoordde dat hij graag op het eerste vlak van het schaakbord één graankorrel zag, en op elk daarna volgende vlak de dubbele hoeveelheid graankorrels van het voorgaande vlak. De berg graan waarmee Sissa naar huis ging bedekte 50 keer het oppervlak van de Benelux.

Dit klassieke voorbeeld van exponentiële groei zien we ook terug in het dagelijks leven. In de financiële wereld wordt bijvoorbeeld gebruik gemaakt van samengestelde interest en in de wereld van informatietechnologie wordt vaak aan de wet van Moore gerefereerd die stelt dat  het aantal transistors op een IC elke twee jaar verdubbelt.

Een ander goed voorbeeld zien we terug in de studie van EMC naar de omvang en groei van de Digital Universe. In 2010 groeide de digitale informatieberg 1200 exabyte (1,2 zettabyte). Verder verwacht men dat de informatieproductie jaarlijks met meer dan 40% zal groeien wat er op neerkomt dat de Digital Universe elke 18 maanden verdubbelt.

Nu wordt er in deze studie aan tal van aspecten aandacht besteed maar over de relevantie van de geproduceerde informatie wordt niet gerept. Dat komt waarschijnlijk omdat de vraag of informatie relevant is vaak moeilijk te beoordelen is. Een willekeurige foto van de Eiffeltoren zal door de meeste mensen niet relevant gevonden worden. Vele Eiffeltorenfoto’s zijn alleen relevant voor degene die hem gemaakt heeft.

De relevantie voor anderen is wat moeilijker voor te stellen maar niet onmogelijk. Voor overheden en bedrijven zou deze foto relevant kunnen zijn of worden. Bijvoorbeeld omdat de maker een belangrijk persoon is, of omdat het tijdstip van de  afbeelding een alibi kan verschaffen.  Alleen weet men dat op voorhand niet. Wel weet men dat  er een kans bestaat dat deze op het eerste gezicht onbetekenende Eiffeltorenfoto weleens relevant zouden kunnen zijn of worden. Donald Rumsfeld beschreef dit fenomeen als volgt: ‘There are things we know that we know. There are known unknowns. That is to say there are things that we now know we don’t know. But there are also unknown unknowns. There are things we do not know we don’t know’.

De oplossing voor dit probleem is even briljant als eenvoudig: gewoon zoveel mogelijk verzamelen en bewaren. Over de relevantie kun je later nadenken.

Nu heeft iedereen wel enigszins last van verzamel- en bewaarwoede maar met name overheden zijn er extra bevattelijk voor. Ze verzamelen steeds meer en vaker informatie over wat burgers denken en doen, en dwingen ook bedrijven steeds meer gegevens te bewaren en over langere perioden. Er is een onmiskenbare neiging bij overheden om burgers scherper te controleren. Inzet van ICT is daarbij ideaal. Gelukkig blijkt software voor bijvoorbeeld het gericht doorspitten van informatie nog weinig efficiënt. Software die een combinatie van woordbegrip, grammatica, stijl, context, samenhang, achtergrondkennis en interpretatievermogen in zich verenigt, is (nog) uiterst rudimentair. En voor de vrijheid en privacy van burgers lijkt me dat maar beter ook want Big Brother waart nadrukkelijk rond.

Deze column is eerder verschenen bij Appworks.

Share and Enjoy:
  • Facebook
  • Twitter
  • Google Bookmarks
  • email
  • LinkedIn
  • RSS

About Marcel Warmerdam