Wouter Hoeffnagel - 12 januari 2022

De zes belangrijkste trends aan voor intelligente documentverwerking dit jaar

De zes belangrijkste trends aan voor intelligente documentverwerking dit jaar image

Doculayer.ai is gespecialiseerd in Intelligente Document Processing (IDP) software voor het analyseren en geautomatiseerd verwerken van documentstromen op basis van AI-technologie. Het bedrijf voorziet dit jaar zes belangrijke trends die dominant zijn op het gebied van intelligente documentverwerking.

1) Gebruik van pre-trained modellen

Dit jaar zullen steeds meer leveranciers zogenaamde pre-trained machine learning modellen gaan inzetten voor intelligente documentverwerking. Het gebruik van pre-trained modellen kan de implementatietijd van IDP-oplossingen verkorten als de data gebruikt voor training veel overeenkomsten heeft met de klant-situatie. IDP-oplossingen zijn al populair in de VS en leveranciers uit de VS proberen ook hun oplossingen in Europa te verkopen.

Pre-trained modellen voor diverse verticale markten bieden veel nieuwe mogelijkheden om met IDP-oplossingen een snellere ROI te behalen. Kanttekening daarbij is wel dat veel modellen met name gericht zijn op de Amerikaanse markt en de daar gebruikte documenten. Dat betekent dat deze modellen in Europa met andere bedrijfsprocessen, meer variatie in documenttypes en andere talen niet goed bruikbaar zijn.

Richard Smit (foto), oprichter en CTO bij Doculayer.ai: “Het simpelweg kopiëren van Amerikaanse modellen voor de Europese markt zal zeker niet voldoen voor de meeste Europese use cases. Het opnieuw trainen van een lokaal model voor een specifieke use case kan afhankelijk van de benodigde hoeveelheid trainingsdata alsnog veel inspanning vergen. Onze ervaring leert dat juist het combineren van ML-modellen met logica in de vorm van bedrijfsregels, patronen en scripting vaak betere resultaten geeft met minder trainingsdata en in minder tijd.”

2) Meer pre-built use cases

In het komend jaar kunnen klanten nog meer pre-built use cases verwachten. Voor bepaalde use cases is dan een complete inrichting beschikbaar waardoor de doorlooptijd aanzienlijk wordt verkort. Pre-trained ML-modellen, komen hier uitstekend bij van pas. Wel is het essentieel dat het bij-trainen van pre-trained modellen mogelijk is zodat de behaalde resultaten indien nodig te verbeteren zijn.

3) Transfer learning in opkomst

Om IDP-oplossingen sneller in gebruik te kunnen nemen, wordt vaker gebruik gemaakt van transfer learning. Daarbij wordt een bestaand Machine Learning (ML)-model gebruikt voor het trainen van een nieuw model daarbij aangevuld met additionele trainingsdata om uiteindelijk betere resultaten te behalen.

Bedrijven kunnen in 2022 ook via ‘cross training’ sneller en efficiënter ML-modellen ontwikkelen. Hierbij wordt branchekennis en met name data door verschillende bedrijven verzameld en gedeeld. Zo kunnen ML-modellen met een gezamenlijke inspanning ontwikkeld worden en profiteren meerdere bedrijven van een ML-model voor een branche. Bedrijven kunnen deze modellen vervolgens aanpassen aan de specifieke klantbehoeften.

4) Waardevolle menselijke expertise beter ondersteund door IDP-oplossingen

Inhoudelijke (proces) experts hebben diepgaande kennis van document gerelateerde processen en het type documenten dat gebruikt wordt binnen een organisatie. Om hun kennis beter te gebruiken, zullen er in IDP-oplossingen steeds vaker review- en feedbackmogelijkheden geïmplementeerd worden. Hierbij kunnen experts de automatische classificaties en geëxtraheerde data verifiëren en eventuele correcties doorvoeren of de resultaten bevestigen. Van belang hierbij is dat de oplossing een gebruikersvriendelijke user interface biedt, afgestemd op het soort gebruiker zodat deze ook te gebruiken is voor medewerkers zonder technische achtergrond.

5) Het belang van het beschermen van gevoelige (persoons)gegevens neemt toe

Functionaliteit voor gegevensbescherming in IDP-oplossingen wordt belangrijker in 2022. Nu digitale transformatie in steeds meer sectoren plaatsvindt, zijn steeds meer documenten digitaal beschikbaar. Daardoor kunnen ze makkelijker worden opgeslagen en gedeeld. Het bieden van functionaliteit voor het goed beschermen van de privacygevoelige gegevens die in deze digitale documenten staan, wordt een belangrijk aandachtspunt in 2022.

Smit: “Het beschermen van gevoelige gegevens start met functionaliteit voor het kunnen detecteren ervan in documenten. Vervolgens is het zaak dat deze gegevens geanonimiseerd of zelfs gepseudonimiseerd kunnen worden afhankelijk van de rol of de functie van de medewerker die ze raadpleegt. De laatste stap is dat er een geanonimiseerde versie kan worden gemaakt voor de distributie van een document. Doculayer.ai beschikt al geruime tijd over deze functionaliteit omdat we hier al vroegtijdig op hebben ingezet.”

6) Verschuiving naar nieuwe betaalmodellen

In het verleden betaalden bedrijven vaak voor documentverwerking software op basis van ingeschatte servercapaciteit. In 2022 veranderen deze betaalmodellen steeds meer. Betalen naar gebruik wordt populairder. Bedrijven kunnen dan bijvoorbeeld betalen per pagina die door de software verwerkt wordt. Dit verlaagt de instapdrempel voor de middelgrote bedrijven en maakt het voor hen ook eenvoudiger de kosten per afdeling te verdelen.

Smit: “Mede door de pandemie zagen we in 2021 dat steeds meer bedrijven werk maakten van digitale transformatie. Het intelligent verwerken van ongestructureerde documenten is daar steeds vaker onderdeel van. Bij financiële instellingen was deze trend al gaande maar nu zien we dat deze belangstelling zich uitbreidt naar andere sectoren zoals de gezondheidszorg, de pharmaceutische industrie, de logistiek en de overheid. Daarom verwachten wij dat de vraag naar intelligente oplossingen voor het verwerken van documenten dit jaar verder zal stijgen.”

Copaco | BW 25 maart tm 31 maart 2024 Trend Micro BW BN week 10-11-13-14-2024
Copaco | BW 25 maart tm 31 maart 2024