Redactie - 15 juni 2017

Data Analytics in heldere taal

Je hebt budget gereserveerd om te innoveren, je staat aan de vooravond om te gaan werken met de nieuwe “olie”: Data. Je besluit data scientists aan te nemen. Een goed begin, en nu? Waar moeten ze beginnen? Welke tools moeten ze gebruiken en welke databronnen zijn geschikt? Wat is de doorlooptijd van een data science proces, wanneer is het resultaat acceptabel en hoe breng je een mooi model in de praktijk? Big Data, Artificial Intelligence, Machine Learning, Deep Learning; je kan er tegenwoordig niet meer omheen. Maar... wat betekenen die begrippen nu eigenlijk en hoe wordt dit daadwerkelijk toegepast in de business? Met deze nieuwe serie blogs wil BPAnalytics de business user meenemen in de wereld van data analytics in een begrijpelijke taal.

Schermafdruk_2017-06-15 15.27.51.png

Wat is Data Science nu eigenlijk?

In de afgelopen jaren is de hoeveelheid verzamelde en beschikbare data explosief gegroeid. Tot 2020 groeit data jaarlijks met ca. 42% per jaar. Hierbij praten we niet alleen over data als getallen in tabellen (gestructureerde data) maar ook over documenten, chats, posts, foto’s, video’s, geluidsfragmenten, etc. (ongestructureerde data). Om voordeel te behalen met deze data, is het belangrijk deze gegevens te vertalen naar bruikbare informatie. De transformatie van hoeveelheid data naar informatie wordt gedaan door middel van data analytics. Deze nieuw vergaarde kennis kan vervolgens gebruikt worden om systemen, processen en beslissingen data gedreven te maken.

Data Analytics Proces

Een gemiddeld data analytics proces kun je opdelen in 3 fases: data processing, transformatie en visualisatie. Het proces begint bij de business zelf waar een verzameling data aanwezig is waar informatie uitgehaald kan worden. Je kunt hierbij denken aan data van je klantenbestand, uit financiële systemen of bijvoorbeeld logistieke administratie. Daarnaast is het mogelijk om externe databronnen te integreren in je analyse, zoals bijvoorbeeld weerdata en social media.

BP_Analytics.png

 

A. Processing – In deze fase wordt er overzicht geschept in de grote hoeveelheid data die aanwezig is, zodat deze gebruikt kan worden voor de transformatie en de visualisatie stap. Deze processing fase is het meest tijdsintensief, gemiddeld kost dit 70% van de tijd. Tijdens deze fase wordt de data o.a. ‘gecleand’ en in het juiste formaat gezet.

B. Transformatie - Tijdens de transformatie fase worden verschillende data gecombineerd en getransformeerd in analytics modellen. Op deze manier wordt er nieuwe informatie uit de data gehaald. De analytics modellen zoeken naar verborgen trends en verbanden zodat u meer inzicht krijgt over uw bedrijfsprocessen.

C. Visualisatie - In de visualisatie fase worden de resultaten van de getransformeerde data inzichtelijk gemaakt voor de gebruiker door middel van visualisaties. Door gebruik te maken van de juiste visualisatie methodes en tools is het mogelijk om de verborgen informatie in uw data begrijpelijk en bruikbaar te maken.

Volgende blogs

In volgende blogs worden o.a. de volgende onderwerpen besproken: lerende algoritmes zoals neural networks, data analytics toepassingen, exploitatie van oplossingen en data privacy. Kun je niet wachten op de volgende blogs...? Kijk op onze website of neem contact met ons op.

Over Ymke de Jong, Data Scientiste, BPAnalytics

Deze serie blogs wordt geschreven door Ymke de Jong, data scientiste bij BPAnalytics. BPAnalytics focust zich op het adviseren, ontwikkelen en exploiteren van data analytics vraagstukken in de business. De insteek van BPAnalytics differentieert zich in de vertaalslag van de technische taal naar de businessBlog:

Blog: Ymke de Jong, Data Scientist @BPAnalytics – juni 2017