Nieuws

 

Deze week werd in de UK een schokkende ontdekking gedaan. Een forensisch laboratorium in de Engelse stad Manchester heeft mogelijk meer dan tienduizend rechtszaken benadeeld door data te manipuleren. Data die als betrouwbare bron werd beschouwd en werd gebruikt om te komen tot meer dan tienduizend veroordelingen is naar alle waarschijnlijkheid onbetrouwbaar. Een juridische catastrofe.

Het zoveelste bewijs hoe belangrijk het is om te valideren of de data die je gebruikt, juist is. En dat is een vraag die in de huidige data-mine rush (get it?) veel en veel te weinig wordt gesteld. Bronnen na bronnen worden opgeslurpt en na kruisvergelijking met weer andere bronnen wordt de resulterende informatie vaak zonder enige validatie geïnterpreteerd en gepresenteerd.

 

Ik maak dat veel te vaak mee. Bij overheden én bij bedrijven. Iedereen heeft een fijn draaiierig gevoel bij alle mogelijkheden die datagestuurd werken in potentie biedt. Dat ontslaat je echter niet van je verantwoordelijkheid om daar zorgvuldig mee om te gaan.

Natuurlijk, je kunt een kek datalab oprichten of een blits dashboard maken en je doet helemaal mee met de data-hype. (Sterker, als je tegenwoordig niet minimaal een data scientist bent, tel je gewoon niet mee.) Maar je kunt nog zo data-minded zijn, als je bronnen niet valide zijn, heb je gefaald. Kun je er niks mee. Zonde. Weggegooid geld. Reden tot bezinning.

Maar.... Wat als de invalide bron niet wordt ontdekt... En er beslissingen worden genomen op basis van invalide of zelfs gemanipuleerde data? Dan zijn de gevolgen niet te overzien. En -even opletten!- je bent als overheid of bedrijf volledig aansprakelijk als er schade ontstaat naar aanleiding van die beslissingen.

Daarom is het ontzettend belangrijk om altijd(!) je data te valideren. Niet eenvoudig, maar de moeite altijd waard. Helaas komt volledig 'schone' data bijna niet voor en er zijn ook nog eens meerdere soorten manieren waarop data invalide kan zijn.

Hoe staat het met de kwaliteit van data in uw organisatie? Check het nu!

Protip: Mijn collega en datagoeroe Lotte Meindertsma heeft voor ons normale stervelingen een handige checklist opgesteld om die te herkennen. Download haar whitepaper over de kwaliteit van data hier.

Robert Mekking