Beste bezoeker,

op dit moment wordt er een nieuwe release doorgevoerd op GEMMA Online. Hierdoor is de omgeving tijdelijk niet beschikbaar.

Vragen? Stuur een e-mail naar gemmaonline@vng.nl

Met vriendelijke groet, Kenniscentrum Architectuur VNG Realisatie

Katern GEMMA Tactisch Gegevensmanagement

Laatst bewerkt: 1 juli 2021, 14:03:55
Gegevenskwaliteit

Als gegevens een onmisbare pijler zijn van onze informatievoorziening en van onze beslissingsondersteuning, dan is de kwaliteit van die gegevens in hoge mate bepalend voor de kwaliteit van onze informatie en van onze beslissingen. Dit hoofdstuk gaat daarom in op gegevenskwaliteit. Het begrip ‘gegevenskwaliteit’ kan worden gedefinieerd als de mate waarin de karakteristieken van de gegevens voldoen aan expliciete en impliciete behoeften onder gespecificeerde condities. Of populair uitgedrukt: ‘fit for use’, een omschrijving die duidelijk maakt dat de afnemer bepaalt wat de gewenste kwaliteit is.

Maar wat zijn dan die karakteristieken of die behoeften (al dan niet im- of expliciet), en die specificaties? Wanneer is het goed? Wat is de norm en wanneer voldoe je eraan? Dat verschilt per soort gegeven; elk werkveld heeft haar eigen normen. Het voert dan ook te ver om deze allemaal in dit katern te behandelen. We bieden daarom een raamwerk waarmee je voor elk werkveld de zorg voor gegevenskwaliteit kunt inrichten. We pleiten ervoor om je kwaliteitszorg en het gegevensmanagement te linken aan het gemeentelijk risico-management.

Kwaliteit
Figuur - Kwaliteit


Gegevenskwaliteit: waarom, hoe en wat?

Het waarom, hoe en wat van gegevenskwaliteit verbinden we aan de elementen van ons raamwerk. In deze paragraaf wordt elke laag van het waarom, wat en hoe toegelicht en verbonden aan de elementen van het raamwerk. Voor elke laag geldt een permanente Plan-Do-Check-Act (DEMMING/PDCA-) cyclus, om te weten of je nog actueel en in control bent als het gaat om de kwaliteitszorg over je gegevens

Waarom: Bewustzijn en managementaandacht

De behoefte aan kwaliteitszorg begint bij bewustzijn over de impact van gegevens. Het gaat dan om bewustzijn bij zowel gegevensleveranciers, gegevensafnemers als de betrokken opdrachtgevers:

  • Weet waar een gegeven voor gebruikt wordt, in een proces of in stuurinformatie.
  • Weet welk effect het kan hebben als een gegeven niet correct is.
  • Weet wat de (gebruiks-)waarde van gegevens is; weet ook wat de prijs/kost is van goede gegevens en anderzijds, wat de (potentiële) schade is als gegevens niet goed zijn.

Anders gesteld: weet dat goede gegevens geld kosten, maar dat de kosten veel hoger (kunnen) uitvallen als je slechte gegevens gebruikt.

Gegevensbewustzijn en kwaliteitsbewustzijn vragen een constante dialoog tussen de relevante spelers in de organisatie. Organiseer, of structureer, deze dialoog in een PDCA-cyclus. Veranker de afspraken uit de dialoog in planningen, begrotingen, voortgangsrapportages en risico-management (incl. maatregelen). Dit is een constant leertraject, te ondersteunen met opleiding, training en bewustwordingstrajecten.

Hoe: Rollen/verantwoordelijkheden, resultaten

Stakeholdermanagement is een belangrijk element van de kwaliteitszorg over onze gegevens. Wie spelen een rol en hoe zijn de belangen verdeeld? Wij hebben dit in het Katern Gegevensmanagement vertaald naar een gegevensfunctiehuis en RACI-matrix. Deze matrix helpt bij het in kaart brengen van de rolverdeling, en de verantwoordelijkheden, rondom een gegevensset. Vanuit de matrix is ook inzicht te geven over wie aan wie rapporteert over de behaalde resultaten.

NB de gegevenskwaliteit wordt vaak bij de bronhouder belegd. Dat betekent dat de bronhouder zelf het gegevenskwaliteitproces inricht of apart belegt binnen de gemeente om het gegevenskwaliteitproces uit te voeren / te bewaken. Het is dan wel de verantwoording van de bronhouder, het betekent niet dat de andere betrokken partijen hier geen rol in spelen.

Per gegevensset stel je vast hoe je zult monitoren en rapporteren over het behaalde resultaat ten opzichte van de daarvoor geldende norm. Dat kan met behulp van audits, voortgangsrapportages/managementinformatie op kpi’s. Ook is aan deze check (in de PDCA-cyclus op het hoe) vorm te geven via bijvoorbeeld periodieke bestandsvergelijkingen. Daarnaast is de terugmelding een uitermate krachtig kwaliteitsmiddel. Het is een zelf-reinigend mechanisme: elke afnemer is verplicht om terugmeldingen te doen, de bronhouder is verplicht om de terugmeldingen te onderzoeken.

Bestandsvergelijkingen, bijv.:

  • i-Spiegel 2.0
  • Foto-foto-vergelijking of foto-kaart-vergelijking (bij de BAG of de BGT)
  • Adresonderzoeken
  • Signalering ‘vreemde’ mutaties (anomalieën)

Vanuit het adagium ‘garbage in garbage out’ kan het soms handig zijn om de ‘garbage’ te laten zien. Door de garbage te tonen:

  • Wordt de inhoud van de registratie gelouterd. Het niet tonen laat de fout immers bestaan.
  • Worden zwakke plekken in betreffende processen getoond.

Terugmelding:

  • Digimelding
  • Ogen & oren in de stad
  • Belanghebbenden corrigeren zelf: democratisering van de registratie

Wat: Dimensies, Ist en Soll

Wat kwaliteit is, is te specificeren naar een aantal kenmerken van een gegeven. Van deze kenmerken is vast te stellen

  • wat de daarvoor geldende norm is en
  • hoe je daar als organisatie op presteert.

Normen zijn veelvuldig: ISO, NEN, wettelijke voorschriften (denk bijv. aan de basisregistraties), informatiemodellen. Normering is ook te vinden in statistische betrouwbaarheid (de kans dat de gemeten waarde in een statistische proef representatief is voor de werkelijke waarde) en in correlatie-coëfficienten. Neem ook in ogenschouw de normen die voortvloeien uit afspraken die je contractueel bent overeengekomen, zowel intern als extern. Welke (kwaliteits-)afspraken heb je gemaakt; welk service level ben je aangegaan?

In Bijlage D is een voorbeeld opgenomen van de gemeente Tilburg: hoe kun je een continue verbetering op de gegevenskwaliteit nastreven?

Normen

Omdat het gemeentelijk werkveld zo divers is, hebben we te maken met een ruime wereld van normen. Het is daarom niet zinvol om deze hier allemaal de revue te laten passeren. Een voorbeeld is de wet op basisregistraties die duidelijk maakt welke bronnen worden gebruik voor het vullen van de velden in een basisregistratie, inclusief de omschrijving van de definitie van het veld. Tegelijkertijd is er dus niet een algemene gegevenskwaliteit vast te stellen voor al die verschillende producten binnen een gemeente. Een overzicht van alle betrokken wet- en regelgeving is opgenomen in Bijlage G.

Stel dus in eerste instantie vast welke (kwaliteits-)normen gelden ten aanzien van een gegevensset. Leg daarbij vast volgens welke toetsing-, auditing- en rapportage-methodiek je de check uit de PDCA doet. Een voorbeeld daarvan is de ENSIA-methodiek .

Om een overzicht te geven van welke kenmerken de kwaliteit van een gegeven bepalen, sluiten we aan bij de indeling die daarvoor is opgesteld in het kader van de gegevenskwaliteit in de Omgevingswet . Deze is bruikbaar als checklist voor elke gegevensset in elk gemeentelijk werkveld en. Dit is geen uitputtende lijst, en omdat deze binnen het project van de omgevingswet in 2018 is ontwikkeld, wel een van de meest actuele en toepasselijke indeling.

kwaliteitsdimensies uit het document Gegevenskwaliteit in de Omgevingswet
Figuur - kwaliteitsdimensies uit het document Gegevenskwaliteit in de Omgevingswet


Het gaat dan om de volgende kwaliteitsdimensies (met korte omschrijving):

  • Nauwkeurigheid (Accuracy) - De mate waarin gegevens de echte waarde van het bedoelde attribuut of een concept of gebeurtenis in een specifieke gebruikscontext goed weergeven.
  • Compleetheid (Completeness) - De mate waarin gegevens gerelateerd aan een object waarden hebben voor alle verwachte attributen en gerelateerde object instanties in een specifieke gebruikscontext.
  • Consistentie (Consistency) - De mate waarin gegevens niet in tegenspraak zijn met andere gegevens in een specifieke gebruikscontext. Dit kan zowel binnen de context van een object als tussen vergelijkbare attribuutwaarden van verschillende objecten.
  • Plausabiliteit (Credibility) - De mate waarin gegevens worden beschouwd als waar en geloofwaardig door gebruikers in een specifieke gebruikscontext.
  • Actualiteit (Currentness) - De mate waarin gegevens recent genoeg zijn in een gebruikscontext.
  • Toegankelijkheid (Accessibility) - De mate waarin gegevens benaderd kunnen worden in een specifieke gebruikscontext, met name door mensen die ondersteunende technologie of speciale configuraties nodig hebben vanwege een functiebeperking.
  • Compliance (Compliance) - De mate waarin gegevens conformeren aan standaarden, conventies of regelgeving gerelateerd aan gegevenskwaliteit in een specifieke gebruikscontext.
  • Vertrouwelijkheid (Confidentiality) - De mate waarin gegevens alleen toegankelijk en interpreteerbaar zijn door geautoriseerde gebruikers in een specifieke gebruikscontext.
  • Efficiëntie (Efficiency) - De mate waarin gegevens verwerkt kunnen worden en de verwachte performanceniveau's bieden door het gebruik van de juiste hoeveelheid en soorten middelen in een specifieke gebruikscontext.
  • Precisie (Precision) - De mate waarin gegevens exact of onderscheidend genoeg zijn voor een gebruikscontext.
  • Traceerbaarheid (Traceability) - De mate waarin toegang tot gegevens of wijzigingen erin vastgelegd worden in een audit trail in een specifieke gebruikscontext.
  • Begrijpelijkheid (Understandability) - De mate waarin gegevens eenvoudig gelezen en geïnterpreteerd kunnen worden door gebruikers, en zijn verwoordt in geschikte talen, symbolen en eenheden in een specifieke gebruikscontext.
  • Beschikbaarheid (Availability) -De mate waarin gegevens kunnen worden geraadpleegd door geautoriseerde gebruikers of applicaties in een specifieke gebruikscontext.
  • Overdraagbaarheid (Portability) - De mate waarin gegevens kunnen worden geïnstalleerd, vervangen of verplaatst van het ene systeem naar een ander met behoud van kwaliteit in een specifieke gebruikscontext.
  • Herstelbaarheid (Recoverability) - De mate waarin gegevens een gespecificeerd niveau van operatie en kwaliteit kunnen behouden, ook in het geval van falen, in een specifieke gebruikscontext.

Vervolgens kun je per bovengenoemde dimensie de aspecten benoemen. In de eerder genoemde gegevenskwaliteit in de Omgevingswet is dit uitgebreid per dimensie uitgewerkt, ter illustratie halen we hier een voorbeeld aan:

Stelling
Dataset compleetheid van de objecten waarvan het bestaan bekend is, het percentage waarover informatieobjecten zijn opgenomen in de registratie
Object compleetheid percentage van de informatieobjecten waarin alle in het informatiemodel als verplicht gemarkeerde attributen zijn voorzien van een attribuutwaarde
Metadata compleetheid percentage van de metadata attributen die zijn gevuld met een attribuutwaarde
Overcompleetheid percentage van de informatieobjecten die onterecht zijn opgenomen omdat zij:
  • niet passen bij de overeengekomen scope van de dataset
  • conform het informatiemodel overlappen met een ander informatieobject (duplicaten)
  • onterecht zijn geïdentificeerd als behorend bij een specifiek objecttype (classificatie correctheid)
Historie percentage van de objecttypes waarvan voor alle momenten van geldigheid van de registratie informatieobjecten aanwezig zijn
Geo-gerefereerd van de informatieobjecten die gegevens over geo-objecten vastleggen, het percentage van de informatieobjecten dat is voorzien van een geo-referentie