Beste bezoeker,

op dit moment wordt er een nieuwe release doorgevoerd op GEMMA Online. Hierdoor is de omgeving tijdelijk niet beschikbaar.

Vragen? Stuur een e-mail naar gemmaonline@vng.nl

Met vriendelijke groet, Kenniscentrum Architectuur VNG Realisatie

Katern GEMMA Tactisch Gegevensmanagement

Laatst bewerkt: 6 juli 2021, 14:01:18
Bijlage G: Gegevenssoorten en interoperabiliteit

Informatie wordt vaak verward met de begrippen ‘gegevens’ en ‘kennis’. Deze begrippen hebben veel met elkaar te maken maar zijn geen synoniemen van elkaar. Gegevens zijn feiten en begrippen en kunnen door interpretatie en verwerking leiden tot informatie. Gegevens worden pas informatie als ze voor de ontvanger een betekenis hebben. Een bekend voorbeeld van het onderscheid tussen informatie en gegevens is uit te leggen aan de hand van een telefoonboek. De telefoonnummers uit het telefoonboek zijn gegevens. Ze kunnen worden verwerkt. Men kan de telefoonnummers oplopend sorteren op abonneenummer, maar men kan de gegevens ook sorteren op achternaam. Men kan een selectie maken van alle nummers met een bepaald netnummer. Als iemand het telefoonnummer van zijn moeder zoekt in het telefoonboek, om dat nummer vervolgens te bellen, dan is dat ene nummer in combinatie met de wetenschap dat dat nummer van je moeder is de informatie. Het interpreteren en integreren van informatie resulteert in kennis. Door gegevens te combineren kan informatie worden verkregen en door deze informatie te integreren en combineren wordt kennis verkregen. Door deze kennis te gebruiken wordt het mogelijk beter te organiseren en te presteren. Het niveau en de kwaliteit van de kennis wordt mede bepaald door de kwaliteit van de onderliggende gegevens.

Door organisaties worden diverse soorten gegevens gebruikt. Denk bijvoorbeeld aan tekst, beeld, geluid, spreadsheets, databases, statistische gegevens, administratie gegevens, geografische gegevens, etc. Deze soorten gegevens zijn onder te verdelen in gestructureerde gegevens, ongestructureerde gegevens en metagegevens. Gegevensmanagement moet borgen dat al deze gegevens op het juiste moment met de juiste kwaliteit op een veilige en transparante wijze beschikbaar kunnen worden gesteld.

  • Gestructureerde gegevens zijn gegevens welke op een abstract niveau beschreven worden in de vorm van informatiemodellen en op fysiek niveau door logische datamodellen met entiteit typen en attributen. De gegevens zelf vormen instanties van deze typen. Voorbeelden van gestructureerde gegevens zijn de naam van een persoon en de straatnaam van het adres van de persoon.
  • Ongestructureerde gegevens zijn gegevens die niet via logische datamodellen geordend zijn. Voorbeelden van ongestructureerde gegevens zijn tekstverwerker documenten, e-mails, foto's, videobestanden, geluidsbestanden, e-mails en webdocumenten.
  • Metagegevens zijn gegevens die karakteristieken van andere gegevens beschrijven. Het zijn gegevens over gegevens. De metagegevens bij een ongestructureerd gegeven kunnen bijvoorbeeld zijn: de auteur, de datum van schrijven en de uitgever. Eén van de redenen om metagegevens op te slaan is het vereenvoudigen van het zoeken naar ongestructureerde gegevens of het relateren van ongestructureerde gegevens aan gestructureerde gegevens.
Gegevenssoorten
Figuur - Gegevenssoorten


Bij de uitwisseling van gegevens is het van belang om maximale interoperabiliteit te behalen. Met interoperabiliteit wordt hier bedoeld het met elkaar laten communiceren en interacteren van verschillende autonome systemen. Om dit te bewerkstelligen zijn standaarden, protocollen en procedures nodig. Informatiemodellen standaardiseren gegevensuitwisseling op het vlak van structuur en syntax. Deze standaardisatie wordt vaak gezien als dé oplossing voor interoperabiliteit. Op technisch niveau klopt dat ook. Als organisaties op dat niveau afspraken maken over programmatuur, uitwisselingsformaten en codes, dan kunnen zij informatie uitwisselen. Door het gebruik van standaarden wordt gegevens uitwisselen efficiënter, transparanter en worden fouten en verlies van gegevens in de uitwisseling voorkomen. Maar wie semantiek van gegevens probeert te standaardiseren, probeert de werkelijkheid te standaardiseren. Het is van belang te erkennen dat verschillen in betekenis relevant kunnen zijn. Of die verschillen nu voortkomen uit wetgeving of alleen herkenbaar zijn in de uitvoeringsprocessen. Als betekenissen samenvallen, kunnen ze gestandaardiseerd worden. Als verschillen in betekenis echter relevant zijn, moeten de variaties naast elkaar kunnen bestaan en is het niet effectief, en zelfs niet wenselijk, om te proberen ze weg te standaardiseren. Bij het vaststellen van de semantiek is het dus van belang om de context te kennen waarin de gegevens gebruikt worden.