Datakwaliteit op orde brengen

Hoe doe je dat?

Scholen willen steeds meer de kansen van het werken met data benutten. Wanneer je werkt met data, moet de data van goede kwaliteit zijn. Alleen dan zal het werken met data ook echt omarmt worden. Maar hoe zorg je daarvoor? Graag delen we in dit artikel (1) inzicht in wat datakwaliteit is en (2) bieden we een handige ‘cheatsheet’ om binnen je eigen school de kwaliteit op orde te brengen. Dit zijn opbrengsten van een werkgroep binnen de Datacoalitie Datagedreven Onderzoek MBO.

Stel er is bij jullie slb’ers behoefte aan inzicht en onderzoek omtrent data vanuit verzuimgegevens. Dan is daar data over beschikbaar binnen de school. De data die daar binnen de school voor wordt verzameld, is (vaak) verzameld ten behoeve van aanlevering bij het verzuimloket. De slb’er, wil mogelijk andere ‘vragen stellen’ dan het verzuimloket én data op een andere manier gebruiken. Wat betekent dat voor de data die je verzameld? Zijn er andere gegevens nodig? Hoe kunnen die handig worden vastgelegd? Hoe snel moeten de gegevens beschikbaar zijn? Welke processen moeten daarvoor worden ingericht? 

Hoe meer de kansen van het werken met data binnen de school benut gaan worden, hoe vaker dit soort vragen zullen opkomen. Deze vragen raken aan wat we noemen ‘datakwaliteit’. Wat is het? En hoe zorg je dat het op orde is?

Wat is datakwaliteit?

Er is binnen onderwijsinstellingen steeds meer data beschikbaar. Belangrijk is dat data die gebruikt wordt voor onderzoek en informatievoorziening van goede kwaliteit is. Dat is niet altijd het geval. Soms wordt data door verschillende gebruikers verschillend ingevoerd, wordt het met een ander doel vastgelegd of wordt invoer onvoldoende gecontroleerd. 

Met behulp van literatuuronderzoek1 is de werkgroep tot 8 aspecten gekomen die bepalen of de kwaliteit van data op orde is. 

Een korte toelichting per aspect:

  • Uniek: data moet uniek zijn. Gegevens komen maar 1 keer voor in de systemen.
  • Relevant: de gegevens zijn relevant voor de gebruiker en het beoogde doel.
  • Volledig: data moet volledig zijn. 
  • Eenduidig: de data is op 1 manier te interpreteren
  • Consistent: de data is over systemen heen en binnen systemen consistent. 
  • Accuraat: de gegevens geven de werkelijkheid goed weer
  • Tijdigheid: de data moet tijdig verwerkt worden 
  • Validiteit: validiteit gaat over de vorm van de ingevoerde data. Staan er – of / tussen?

In het document ‘Datakwaliteit in het mbo’ worden de aspecten verder toegelicht met voorbeelden. 

Om aan de bovenstaande aspecten te voldoen moet data soms ‘gerepareerd’ worden zodat het alsnog voor onderzoek en informatievoorzienign gebruikt kan worden. Ook is het belangrijk om te kijken naar het proces waarin de data tot stand komt: waar kunnen structurele verbeteringen doorgevoerd worden? De werkgroep heeft een stappenplan ontwikkelt dat scholen daarbij helpt.

In 5 stappen kwaliteit van data onderzoeken & verbeteren

De 5 stappen die bedacht zijn door de werkgroep zijn als volgt:

Stap 1: Voorbereiding en inventarisatie – wat is het vertrekpunt en beoogd doel
Stap 2: Situatie in beeld – aan de slag met de indicatoren en de data
Stap 3: Diagnose & onderliggende oorzaak
Stap 4: Interventie
Stap 5: Borging & opname in de organisatie

In dit document zijn de stappen uitgebreider toegelicht, met per stap een beschrijving van de bijbehorende vragen en activiteiten. 

De cheatsheet: onderzoeken en verbeteren van datakwaliteit 

De 5 stappen zijn samengepakt in een overzichtelijke ‘cheatsheet’. Deze sheet is handig in gebruik binnen de school. De sheet kan als stappenplan gebruikt worden om de stappen 1 voor 1 te doorlopen. Het kan ook goed helpen als gespreksleidraad om met collega’s intern te bepalen wat er nog nodig is om de kwaliteit van bepaalde data ten behoeve van bepaalde indicatoren te verbeteren.

Zelf aan de slag?

Wil jij met jouw instelling aan de slag met het verbeteren van datakwaliteit? Gebruik dan cheatsheet voor je aanpak en om in gesprek met betrokkenen te ontdekken waar voor hen de belangrijkste behoefte zit. Wil je meer weten over de opgedane inzichten en ervaringen van collega’s, neem dan contact op met de datacoalitie via Willem-Jan Swiebel (willemjan@swiebel.nl). 

Downloads:

  1. https://smartbridge.com/data-done-right-6-dimensions-of-data-quality