Redactie - 15 november 2016

Data Governance

In ons bedrijf hebben we sinds enkele jaren een Chief Data Governance Officer. Haar taak is om vanuit een business verantwoordelijkheid, data governance uit te voeren. Met de groeiende verzamelingen van data in datalakes en de groei van analytics om op basis van verzamelde data intelligence te verkrijgen, is het meer dan nodig de governance van al die data zeker te stellen. Het verzamelen van data levert immers ook aansprakelijkheden op.

In een interview met haar legt Barbara Latulippe uit waarom haar functie is ontstaan en wat haar taken zijn. Simpel gezegd: zij organiseert de governance voor alle datalakes die er in ons bedrijf zijn en stelt essentiële vragen over het gebruik. Waarom is data nodig? Wie was, is of wordt eigenaar van die data? Voor welk doel gaat die data gebruikt worden? Welke jurisprudentie is geldig voor die (soort) data en het (potentiele) gebruik ervan?

Metadata
Eigenlijk gaat het om het goed managen van al je metadata, een vak waar het oude EMC intern en extern veel credit heeft opgebouwd: het (kunnen) labelen en catalogiseren van data en de kunst van dataclassificatie. Dat is het fundament van data management en de eerste stap om data governance mogelijk te maken.

Haar passie voor metadata kan ik met mijn historie in de vliegtuigbouw volledig begrijpen, omdat je in die industrie ook decennia later nog moet kunnen aantonen welk product door wie waarom op welk tijdstip volgens een geldig ontwerp en proceshandboek is gemaakt om aansprakelijkheid te kunnen afleggen als zo’n onderdeel later oorzaak van een ongeluk wordt.

In de wereld van informatieproducten is die aansprakelijk evenzeer aanwezig. Als een beslissing op basis verkeerde informatie, ontstaan uit verkeerde data decennia later ongelukken oplevert, wil je immers de oorzaak en veroorzaker kunnen traceren. Data-eigenaarschap en governance gaan hand in hand. Eigenaarschap van data geeft verantwoordelijkheden en aansprakelijkheden. Dus bezint voor je begint met het verzamelen van data.

Van wie is de data?
Als iemand data bezit, is deze persoon of organisatie verantwoordelijk voor de kwaliteit en zuiverheid van die data. En zuiverheid is niet alleen dat de data schoon, onbesmet en doorzichtig is, het moet ook rechtvaardig gemaakt of verkregen zijn. Een verantwoordelijkheid die niet bij de IT-afdeling, maar bij de business ligt. Hoewel we als bedrijf een data governance office hebben, ligt de tactische verantwoordelijkheid bij de lijnmanagers. Zij moeten zorgen dat hun dataproces aan alle (wettelijke) vereisten voldoet.

Ik gebruik wel eens het voorbeeld, dat je een exportvergunning nodig hebt om een wapen te exporteren. Als je die vergunning niet hebt en toch dat wapen exporteert, kun je als persoon strafrechtelijk vervolgd worden. Wat nu als je de digitale gebruiksaanwijzing van dat wapen exporteert? Of een digitaal wapen? Dan geldt dezelfde noodzaak van een exportvergunning en als je die niet heb, is strafvervolging mogelijk. Dan wordt de vraag wie formeel data-eigenaar is opeens een serieuze en zelfs persoonlijke kwestie.

Hoeveel is data waard?
Een ander aspect is de waarde die data vertegenwoordigt voor een organisatie. Zeer waardevolle data die niet is gelabeld en gecatalogiseerd, heeft in de praktijk weinig of geen waarde. Het is verborgen goud dat lastig te delven en zeker niet direct bruikbaar is. Het bepalen van de (verborgen) waarde van data is een van de taken die bij data governance hoort. Het ontwikkelen van algoritmen om die waarde te bepalen, zijn essentieel om dit proces uit te voeren. Laat staan wanneer dat geautomatiseerd moet worden, dat bij zeer grote data-hoeveelheden een vanzelfsprekende noodzaak wordt.

Het vakgebied van data governance is snel groeiend omdat de waarde van data enorme impact op de business heeft. Het gaat immers om initiële waarde, beschikbaarheid en toepasbaarheid van datasets om er meerwaarde aan te kunnen geven. Hoe hoger die waarde, des te belangrijker het is de governance goed te regelen.

Geldwaarde
Intern proberen we de waarde van data in geld uit te drukken. Op die wijze kun je data relateren aan je business strategie. En de balans tussen beschikbaarheid en bescherming in evenwicht houden. Data is zowel goud als olie. Als goud moet je er alles aan doen het goed te beveiligen en te beheren. Als olie is het de smeerolie voor de organisatie, het vrijelijk kunnen stromen van data om er een geolied proces mee te kunnen realiseren.

Als je datalakes creëert waar om uiteenlopende redenen door gebruikers data wordt gezocht en gebruikt, wordt die governance best complex. Data governance is een zeer selecte mix van juridische en veiligheidsaspecten en de actuele strategische, tactische en/of operationele waarde voor het business proces, zeker nu dat steeds digitaler en geautomatiseerder wordt.

Digitaal Business Platform
Data als een bezit benoemen en kwalificeren, is een voorwaarde om je organisatie een digitaal platform te laten zijn, waar geautomatiseerde processen de kern vormen. Het is lastig omdat onze (legacy) systemen nooit zijn ontworpen om deze taken uit te voeren: data te labelen, data te volgen en waarde te meten. Bedrijven als Google hebben een ooit een nieuwe infrastructuur opgebouwd die vanaf het eerste begin bedoeld was om data te zoeken, te hanteren, gecatalogiseerd op te bergen en efficiënt te hergebruiken.

De digitale transformatie dwingt organisaties hun hele datahuishouding op de schop te nemen. Het succes van een digitale organisatie staat of valt immers met een robuust en lichtvoetig dataplatform. Wikibon publiceerde onlangs een onderzoek over het Digital Business Platform dat ervan uitgaat dat alle data uiteindelijk een bezit is, hoe klein, groot, operationeel of strategisch ook. En dat inzicht over al je data ook daadwerkelijk benutten, om die data vervolgens gericht aan het werk te zetten.

MyService360
Mede op basis van onze data governance ervaring en het bouwen van digitale platformen, konden we een unieke dienst voor onze klanten te bouwen: MyService360. Deze nieuwe dienst is ontwikkeld met gebruik van datalakes en analytic engines. Het levert de klant een cloud-based, service-centric dashboard van zijn informatie-infrastructuur. Dat gepersonaliseerd de actuele klantsituatie vergelijkt met onze wereldwijde ervaringen. Hierdoor zijn anomaliteiten snel te herkennen, is de root-cause te traceren en kan de gezondheid van de infrastructuur voor de toekomst geborgd worden.

De toekomst bouwen we op basis van data-centrische architecturen. Die zijn gebaseerd op lichtvoetige maar tevens robuuste data-infrastructuren die real time data governance mogelijk maken. Makkelijker gezegd dan gedaan, want onze legacy-platformen zijn daar nooit voor en op, ontwikkeld.

Een huis verbouwen en ook het fundament vernieuwen, betekent eigenlijk een nieuw huis bouwen. Voor veel bestaande informatie-infrastructuren betekent dat eigenlijk hetzelfde. Het is soms beter het oude het oude te laten en ervoor te kiezen een nieuw huis te bouwen. Sommige van onze klanten hebben daar wijselijk al voor gekozen.

Door: Hans Timmerman, CTO Dell EMC Nederland