Hoofdstuk 2

Wat is Data Governance? Een definitie

Data Governance is een fundamentele pijler binnen elke succesvolle datastrategie. Het is een maatwerkaanpak gericht op een breed scala aan aspecten, essentieel voor het halen van optimale waarde uit data. Daarmee is het een overkoepelende strategie die het beleid, de processen en mensen omvat die betrokken zijn bij het beheren, beschermen en optimaal benutten van de waarde van data. Het ligt aan de basis van iedere succesvolle digitale transformatie en is daarmee een cruciaal onderdeel van elk strategisch initiatief binnen de organisatie.

Datakwaliteit

Een van de belangrijkste aspecten van Data Governance is Data Quality. Alleen met data van juiste kwaliteit zijn inzichten betrouwbaar genoeg om er conclusies aan te verbinden. In de praktijk zien we dat dit vaak nog een grote uitdaging is. Zo verliezen bedrijven in Amerika volgens IBM jaarlijks meer dan 3 biljoen dollar door slechte data kwaliteit. Die verliezen komen voort uit onder meer inaccurate besluitvorming en forecasting, verhoogd risico op het gebied van investeringen en privacy en het verkeerd anticiperen op kansen die zich voordoen.

Interventies om de datakwaliteit te optimaliseren verdienen zich dan ook snel terug. Maar hoe gaat dat in zijn werk? We onderscheiden acht criteria om de data kwaliteit te analyseren en gericht te verbeteren.

"Interventies om de datakwaliteit te optimaliseren verdienen zich snel terug."

Analyseren & verbeteren

De 8 kwaliteitscriteria

We onderscheiden acht criteria om de data kwaliteit te analyseren en gericht te verbeteren.
  • 1

    Accuraatheid

    De mate waarin data reallife entiteiten correct weergeven. Denk hierbij aan de correcte spelling van producten of personen.

  • 2

    Volledigheid

    De noodzakelijke data is aanwezig in de systemen.

  • 3

    Consistentie

    Er is consistentie in waarden binnen een dataset en tussen verschillende datasets. Denk hierbij aan eenzelfde datumnotering in twee verschillende datasets.

  • 4

    Integriteit

    Consistentie tussen dataobjecten door een referentiesleutel in beide objecten en interne consistentie binnen een dataset, zodat er geen ontbrekende onderdelen zijn.

  • 5

    Redelijkheid

    Een patroon voldoet aan de verwachtingen. Een voorbeeld hiervan kan zijn dat de year-over-year niet hoger is dan 100 procent.

  • 6

    Tijdigheid

    De meest actuele data en de wisselvalligheid. Denk hierbij aan hoe vaak data verandert en om welke reden.

  • 7

    Uniciteit

    Geen enkele entiteit bestaat meer dan één keer binnen de dataset. Er is dus geen sprake van dubbele records.

  • 8

    Validiteit

    De data is in overeenstemming met de gedefinieerde set aan regels en waarden. Een voorbeeld is dat een afstand tussen twee locaties nooit negatief in kilometers kan zijn.

De aspecten van Data Governance

  • Data Architecture
  • Data Modeling & Design
  • Data Management
  • Data Quality
  • Data Science
  • Data Security & Privacy
  • Data Warehousing & BI
  • Document & Content Management
  • Integration and Interoperability
  • Metadata
  • Reference & Master data
  • Storage & Operations