Redactie - 05 december 2018

7 dingen die iedere executive over Machine Learning moet weten

Machine learning Artificial intelligence Data Big data Digital

De toepassing van Machine Learning (ML) biedt bedrijven enorme mogelijkheden om nieuwe inkomsten te genereren en kosten te besparen. Bedrijven gebruiken ML in toenemende mate om hun concurrentievoordelen te vergroten en innovatie te stimuleren. Grijpt jouw organisatie deze verandering aan of blijf je achter? Als je graag voorop loopt en al begonnen bent om jouw organisatie klaar te stomen voor digitale transformaties als Machine Learning, weet je dan zeker dat je het goed aanpakt?

De afgelopen tien jaar zijn data steeds belangrijker geworden; ze worden zelfs al omschreven als de “nieuwe olie”. Organisaties met grote hoeveelheden data kunnen die gebruiken om de omzet en de klantenbinding te vergroten. Fabrikanten kunnen de gegevens van machines gebruiken om de productie te verbeteren. Met computertomografie gemaakte beelden kunnen worden gebruikt om kankergezwellen te herkennen. Er is letterlijk niet één branche waar data niet kunnen worden aangewend om het ondernemingsmodel te verbeteren of hele nieuwe modellen te creëren. Tegelijkertijd is het nooit makkelijker en minder duur geweest om gegevens te verzamelen, op te slaan, te analyseren en te delen. Dit is precies de reden waarom veel bedrijven momenteel ‘datameren’ aanleggen. Maar maakt jouw organisatie wel optimaal gebruik van de beschikbare gegevens? Ben je tevreden met de waarde die de data genereren? Heb je er moeite mee om slimme applicaties te bouwen voor jouw datameren? Veel ‘big data’, maar weinig nuttige informatie? Veel geschreeuw, maar weinig wol?

In dat geval zijn de volgende tips misschien de moeite waard:

1. Wees probleem- en klantgericht: Wat zijn de voornaamste problemen voor het bedrijf? Ga uit van een concreet probleem en zoek de simpelste oplossing. Veel bedrijven proberen algoritmes uit de sfeer van “zelfsturende auto’s” of “genome sequencing” toe te passen om de sales funnel te optimaliseren, alleen maar omdat ze nu eenmaal een expert op dit gebied in huis hebben gehaald, terwijl er in feite modellen voorhanden zijn die beter geschikt zijn en meer waarde toevoegen tegen lagere kosten. Sluit het data science team daarom niet op in de IT-afdeling. Als andere onderdelen van het bedrijf medeverantwoordelijkheid krijgen over het data science team kan dat de organisatie een belangrijke impuls geven en nieuwe inkomstenstromen en enorme kostenbesparingen opleveren.

2. Snelle en simpele iteratie: Kies bij de bouw van het ML-systeem voor een snelle, doortastende aanpak. Het gebruik van korte iteraties voor de tests, de proofs of concept en de pilots kan het team helpen om ML-toepassingen sneller in bedrijf te nemen, en met een betere kwaliteit. Streef ernaar een productieklaar prototype in 3 weken af te hebben, en een geheel operationele versie in hooguit 90 dagen. Zelfs als het systeem niet het allernieuwste model gebruikt, wordt er meer geleerd van snelle iteratie dan van een langdurige ontwikkelingscyclus. ML-transformaties komen tot stand door kennis en ervaring op te bouwen met kleine, snelle en simpele stappen, en niet op basis van een meerjarenplanning. Aanpassing van het ontwerp is onvermijdelijk. Alleen door te experimenteren, ervaring op te doen en aanpassingen door te voeren, kan het volledige potentieel van het ML-product gerealiseerd worden. Dus: snel fouten maken en vaak verbeteren.

3. ML-teams centraliseren of decentraliseren? Centraliseer de ML-teams indien noodzakelijk, maar probeer ze waar mogelijk te decentraliseren. ML-applicaties hebben net als alle andere software onderhoud, updates en ondersteuning nodig. Een gecentraliseerd team is misschien op beperkte schaal effectief, maar zodra het bedrijf gaat uitbreiden, kan de innovatie hieronder gaan lijden. Stel een groot innovatieteam voor dat aan meerdere vernieuwende projecten werkt: het is onvermijdelijk dat op een gegeven moment een aanzienlijk deel van hun werk in het aansturen van lopende projecten gaat zitten. Dan wordt het misschien tijd om het team onder te brengen waar het thuis hoort, in de business unit die door het team bediend wordt. Het valt soms niet mee om een “kindje” af te staan, maar het helpt het ML-team wel om te blijven vernieuwen, voor de klant.

4. Analyseer de voornaamste hindernissen voor datawetenschappers & ontwikkelaars: 1) vieze data, d.w.z. datasets die ongestructureerd zijn, of attributen missen, worden samen met gemengde datasoorten bewaard; 2) een tekort aan talent; 3) een gebrek aan financiële of managementondersteuning; aangezien ML-projecten aandacht en financiering vergen, hebben organisaties er moeite mee dit soort projecten op de rails te krijgen zonder de steun van het management; 4) gebrek aan duidelijke vragen waarop antwoord moet worden gegeven; organisaties willen dolgraag verbeteren, maar missen de specificaties en targets die nodig zijn om dit te bereiken; 5) data niet beschikbaar of moeilijk toegankelijk. Als alles goed geplant wordt, zullen de meeste van deze hindernissen makkelijk te overkomen zijn. Een tekort aan talent? Haal talent in huis anticiperend op de vraag, en wacht niet tot de wal het schip keert. Data niet beschikbaar? Begin met het verzamelen van gegevens voordat het project van start gaat. Data niet toegankelijk? Laat een workshop niet van start gaan zonder eerst bruikbare datamonsters te verzamelen. Gebrek aan financiële of managementondersteuning? Verzeker eerst van steun. Zoek de stoutmoedige stakeholders die enthousiast zijn over AI en die willen steunen met budgetten en FTE’s, datatoegang en contacten met andere stakeholders in het bedrijf.

5. De scheiding tussen Data Science en DevOps bestaat niet meer! “Onze wetenschappelijke specialisten ontwikkelen ML-modellen en schrijven de specificaties zodat onze ontwikkelaars die in C++ kunnen implementeren.” Als dit herkenbaar is, kan er beter vandaag nog begonnen worden om de structuur van het team aan te passen. Er bestaat inmiddels een groot aantal hulpmiddelen waarmee datawetenschappers kunnen gaan bouwen, en omgekeerd. De scheiding tussen “wetenschap” en “productie” kan leiden tot onnodige verlenging van de ontwikkelings- en innovatiecycli in het bedrijf, wat weer problemen met de kwaliteit en de verantwoordelijkheidsverdeling kan opleveren. Gelukkig staat de technologie niet stil en worden er voortdurend nieuwe tools uitgebracht. Het is nog nooit zo makkelijk geweest voor experts om hun vaardigheden te verbreden en de overstap te maken naar nieuwe gebieden.

6. Streef naar de juiste verhouding tussen Data Scientists en Data Engineers: Wat is de optimale verhouding tussen Data Scientists en Data Engineers? Voor de meeste klanten hangt het antwoord hierop af van de ontwikkelingsfase van het bedrijf. Als de data niet toegankelijk zijn of het niet onderhoudt of in kaart brengt, zijn engineers waardevoller dan wetenschappers. Als er daarentegen al wel een datapijplijn is, een datapakhuis en een datameer beschikt, is er vermoedelijk meer behoefte aan wetenschappers dan aan engineers. Als het bedrijf specifieke behoeften heeft, is dit ook van invloed op de benodigde vaardigheden. Als vuistregel kan ervan uit gegaan worden dat er in de bouwfase 2-3 engineers nodig zijn voor iedere datawetenschapper, en 1:1 wanneer het systeem eenmaal draait.

7. Hanteer duidelijke KPI’s (Key Performance Indicators) om het succes van een project te meten. Neem bijvoorbeeld een online mediabedrijf dat een applicatie wil creëren die gebruikers aanbevelingen doet. “Verbetering van de gebruikservaring” is een prachtig doel, maar als het niet meetbaar is, is het al snel te hoog gegrepen. De betrokken stakeholders kunnen hierdoor zelfs met elkaar twisten over de vraag of het doel überhaupt is bereikt, wat alleen maar tot verspilling en inefficiënte ontwikkeling leidt. Kan de “verbetering van de gebruikservaring” worden gemeten aan de hand van de tijd die de gebruiker op het platform doorbrengt? Het aantal bekeken video’s? Het aantal nieuwe categorieën die de gebruiker uitprobeert? Iedere maatstaf kan leiden tot een ander systeem voor aanbevelingen. Duidelijke doelen en KPI’s helpen om alles efficiënter te plannen en uit te voeren.

ML-initiatieven zijn boeiend en kunnen enorm veel opleveren. Een gebrek aan focus, onvoldoende middelen en onterechte verwachtingen kunnen al snel tot spanningen leiden. Het houden van een “ML Discovery Workshop” waarbij zowel de commerciële als technische stakeholders over ideeën kunnen brainstormen, de voornaamste uitdagingen voor het bedrijf kunnen bespreken en plannen kunnen voorstellen, kan hierbij enorm helpen. Tijdens deze workshop kunnen de belangrijkste uitdagingen op een rijtje gezet worden, de haalbaarheid ervan besproken, inschatten welke inspanningen nodig zijn, de ontbrekende vaardigheden en hulpmiddelen in kaart brengen en een lijst met projecten opstellen met een concreet plan voor de uitvoering. Maar let wel: zelfs het best bedoelde plan van uitvoering komt niet ver zonder een duidelijke focus. Houd dit dus in het achterhoofd: Wees klantgericht, kies voor snelle iteratie, verspreid de Data Science teams waar nodig, anticipeer op hindernissen, kies de juiste personeelsverhoudingen en stel specifieke, relevante KPI’s vast.

Auteur: Yotam Yarden (foto) is Senior Data Scientist bij AWS en helpt bedrijven bij hun ML- en Cloud-projecten

Tip de redactie