Redactie - 19 september 2017

Datameesterschap

Datameesterschap image

Data is het voedsel dat de digitale transformatie drijft. Het is de nieuwe geldeenheid voor de digitale economie. In het centrum van de digitale transformatie ligt uw data-platform. Als de kwaliteit, consistentie, beschikbaarheid en toegang tot uw data niet gegarandeerd zijn, zal de oplossing die u bouwt niet de levensduur hebben die u denkt. Als u niet direct uw data in waarde-transacties kunt omzetten, verliest u omzet en winst. In de digitale economie geldt: ‘zonder data geen handel’.

Data is niet alleen de content van de levering, het legt ook vast wie wat op welk moment met welke data deed. Die gebruiksdata levert een gebruikservaring op die zowel uw inhoud als het proces kan verbeteren. Daarom is het bouwen van een solide centrale datamanagement-strategie zo enorm belangrijk. En hierbij ontstaat ook de vraag of u de data op uw lokale cloudplatform houdt of het naar een gezamenlijk cloudplatform brengt. Cloud is het standaard operations model en lokaal en centraal hebben beiden voor- en nadelen.

File-, object- en stream-data

Blijft data beschikbaar en verplaatsbaar en houdt u er voldoende controle over? Met de nieuwe aansprakelijkheden voor het bezit en gebruik van privacy van data is deze vraag steeds relevanter aan het worden. En welke soort data moet ik organiseren? Er zijn drie soorten dataformaten belangrijk: file-data, zoals we die in het verleden hebben leren kennen, objectdata zoals die op mobiele- en web-platformen wordt gebruikt en ten slotte stream-data, die van apparaten en sensoren in de gelinkte wereld van IoT komt.

Opslag, bescherming en compliance van alle drie soorten data is vitaal om uw dataplatform op orde te houden. Ook moet data makkelijk van formaat kunnen worden veranderd om in elk deel van eigen interne processen alsook in externe processen te kunnen worden toegepast. Deze platformen zijn steeds vaker ongestructureerde dataverzamelingen met erboven software-defined oplossingen waarbij de software de data ter beschikking stelt wat betreft de datasoort, het formaat en de toepassing ervan.

Toekomstvast

Het is begrijpelijk dat met de groei van zowel hoeveelheid als de variëteit van data, deze platformen de ultieme toekomstvaste oplossingen zijn voor digitale processen. Daarnaast kan er een enorme besparing ontstaan als data niet meer dubbel en/of in verschillende formaten wordt opgeslagen. Terwijl dit tevens een aanzienlijke verbetering van de portabiliteit van data realiseert.

Voordat u dus uw data-opslag platformen kunt kiezen, dient uw data-organisatie voor het gebruik per toepassing bekend te zijn. Zowel de portabiliteit als de variëteit van de consumptiemodellen van uw data dienen vooraf helder te zijn gedefinieerd om de juiste services in de markt te kunnen zetten.

Houdbaarheid

Data heeft soms ook een houdbaarheidsdatum, daarna zal de kwaliteit, geldigheid en toepassing ervan geen waarde meer hebben, anders dan historisch materiaal (soms ook belangrijk). Anderzijds heeft data soms geen houdbaarheidsdatum en is het belangrijke ervaring voor gebruik in business intelligence en toekomstige kunstmatige intelligentie. Het zijn twee keerzijden van dezelfde medaille; dezelfde data kan verschillende gedaanten hebben met verschillende toepassing en compliance.

Onbewust bekwaam

Meesterschap in data vraagt oefening en geduld. Uit een onderzoek van Malcolm Gladwell ontstond de 10.000 uur-regel. Het vraagt ongeveer 10.000 uur aan studie en toepassing om een Meester in bepaald vakgebied te worden. Datameesterschap leer je in de praktijk en is een schaars vakmanschap. Begrijpen op hoeveel verschillende manieren je naar dezelfde data kunt kijken, is al een kunst op zich. En die kunst is nodig om alomvattend de datacollectie in je organisatie te kunnen vormgeven. Wie heeft vanuit welke toepassing dezelfde data in een ander formaat nodig om zijn werk uit te kunnen voeren? En wat zijn de logische bevoegdheden van de creatoren, de uiteindelijke eigenaar en soms zelfs onbekende gebruikers van data?

Data of algoritmes?

Zonder data geen algoritmes. De vraag is: wat is belangrijker, veel goede data of veel goede algoritmes? In onze tijd van cloudcomputing is het geen probleem om duizenden CPU’s beschikbaar te maken om een Big Data analyse uit te voeren. Dus de computing-power zelf is geen onderscheidend vermogen meer. Diverse bedrijven, zoals Tesla stellen dat data meer competitief voordeel geeft dan slimme algoritmes. Hun stelling: het bedrijf met de meeste data zal uiteindelijk winnen. Mits die data goed georganiseerd en beschikbaar is.

Ieder bedrijf kan morgen wakker worden en beseffen dat het een software- en analytics-bedrijf is geworden, als zij de digitale transformatie goed uitvoert. Net zoals General Electric ooit overkwam. Niet dat het bedrijf nu opeens software verkocht, maar data en software was één van de belangrijkste ingrediënten van het bedrijf was geworden. Het kostte CEO Jeff Immelt meer dan vijf jaar en vele miljarden dollars om dit te kunnen realiseren.

Opgeslagen energie

Business Intelligence wordt alleen maar beter als het kan rijpen. Als je de tijd neemt om de trends en de gevolgen van trends te begrijpen. En als je die gecondenseerde tijd dan in slimme algoritmes stopt en toepast op de juiste data, kun je veel tijd winnen. In feite zijn algoritmes ingedikte tijd. Vergelijkbaar met fossiele brandstof ontstaan uit miljoenen jaren biologisch opgeslagen energie. Voor algoritmes zijn de eerder gestructureerd opgeslagen data vergelijkbaar de opgeslagen zonne-energie in fossiele brandstoffen. Een bedrijf als Walmart heeft meer dan 40 PB aan data van hun 20.000 winkels in 28 landen gecentraliseerd bij elkaar gebracht. Walmart begrijpt dat data het verschil maakt. Data versterkt de huidige innovatiefase naar de digitale economie. En maakt het mogelijk predictive services mogelijk te maken, machines slimmer te maken, en systemen intelligent in te zetten.

Datameesterschap

Dat geeft uitdagingen om in je bedrijf je dataorganisatie zo in te richten dat het een robuust platform wordt dat schaalbaar, elastisch en compliant genoeg is voor de komende decennia. Daarnaast de vraag: welke data gaan we bewaren en welke data gooien we weg? Hoe gaan we het opslaan, hoe gaan we het beheren en hoe gaan we het beschermen?

Maar de belangrijkste vraag is: wie wordt de ontwerper van dat nieuwe dataplatform? Wie heeft voldoende business- en proceskennis en ervaring om de noodzakelijke dataviews, metadata, compliance en governance voor dat platform vast te stellen, te ontwerpen en de bouw en uitvoering ervan te regisseren. En als u die kennis nog in huis moet halen? Besef dat de 10.000 uren regel voor het opbouwen van onbewust bekwaam datameesterschap een belangrijke beperking is om dit op een achtermiddag even te regelen.

Door: Hans Timmerman, CTO Dell EMC Nederland