Beeldherkenning toepassen

Beeldherkenning kan een gamechanger zijn voor je kwaliteit, snelheid of manier van werken - als je het goed toepast.

Niet alleen de technologie is hierbij belangrijk, maar ook je verwachtingen, en de manier waarop je beeldherkenning praktisch in je processen integreert. 

Op deze pagina lees je meer over de globale werking, de kansen en de valkuilen van beeldherkenning. En als je daarna meer wil weten: onderaan de pagina vind je een intake formulier voor ons advies en kosteninschatting voor de ontwikkeling van jouw beeldherkenning toepassing.

Beeldherkenning een iteratief samenspel van data, experts en feedback
Beeldherkenning: een iteratief samenspel van data, experts en continue feedback

De impact van A.I.

Beeldherkenning is een vorm van AI (Artificial Intelligence). De Wetenschappelijke Raad voor Regeringsbeleid ziet AI als een “systeemtechnologie: technologie met grote, onvoorspelbare impact op de samenleving, vergelijkbaar met elektriciteit of de verbrandingsmotor”.

Beeldherkenning, wat kun je ermee?

Foto’s of video’s kunnen een potentiële goudmijn aan informatie bevatten. Een goede, constante bron van beeldmateriaal neemt echter snel enorme volumes aan. ‘Met de hand’ kun je zulke grote hoeveelheden beeld vaak niet meer verwerken. Automatische beeldherkenning, uitgevoerd door een computer, kan dit wel. Vaak wordt het met beeldherkenning voor een organisatie pas echt mogelijk om beeldmateriaal succesvol, en op grote schaal, te gebruiken.

Hoe werkt het?

Beeldherkenning annotatie
Een voorbeeld van lokalisatie: dieren worden gelokaliseerd in de afbeelding

Beeldherkenning werkt in de basis heel eenvoudig: het algoritme analyseert één beeld en geeft een voorspelling terug. Die voorspelling kan verschillende doelen hebben. De twee meest voorkomende doelen zijn categorisatie en lokalisatie.

Met categorisatie voorspelt het algoritme in welke categorie de hele afbeelding is in te delen. Je ontvangt een lijst met categorieën en per categorie de waarschijnlijkheid (0-100%) van de voorspelling. Bijvoorbeeld: Hond 60%, Kat 40%.

Met lokalisatie voorspelt het algoritme welke onderwerpen er in de afbeelding aanwezig zijn. Je ontvangt een lijst met onderwerpen, hun lokatie (de x,y, breedte en hoogte van een vlak in de afbeelding) en de waarschijnlijkheid (0-100%) van de voorspelling.

Deze twee methodes maken het bijvoorbeeld mogelijk om:

  1. Te bepalen of een container leeg, halfvol of vol is (categorisatie)
  2. Vast te stellen of een boot een zeilboot, motorboot of vrachtschip is (categorisatie)
  3. Fouten of beschadigingen in een product te signaleren (lokalisatie)
  4. Te tellen hoeveel auto’s er op een parkeerterrein staan (lokalisatie)
  5. Uit te rekenen hoeveel oppervlakte van een gebied begroeid is (lokalisatie)

Zes beeldherkenning valkuilen

Hieronder vind je zes valkuilen bij beeldherkenning die vaak voorkomen in de praktijk. Als je deze weet te voorkomen, dan gaat de slagingskans van jouw toepassing aanzienlijk omhoog.

Wat moet beeldherkenning jullie opleveren? Beschrijf dit zo concreet mogelijk.

Het mooie van beeldherkenning: het is een numbers game. Het trainen en testen van modellen gebeurt op basis van cijfers en scores. Dat maakt beeldherkenning een fijne technologie: de resultaten zijn meetbaar – en daarmee stuurbaar.

Werk daarom, voor je zelfs maar begint, eerst eens uit waarom je beeldherkenning zou willen inzetten. En probeer je doelstelling specifiek en meetbaar te maken. Voorbeelden van meetbare doelstellingen met beeldherkenning:

  1. “Een onderzoeker moet 24 uur video gemiddeld in één uur kunnen analyseren.”
  2. “We willen 50% minder tijd besteden aan het beoordelen van beeldmateriaal.”.
  3. “We moeten de foutmarge op metingen terugbrengen naar maximaal 1 cm.”

Verzamel beeldmateriaal in alle ‘smaken’ die in de praktijk voorbij komen.

Een beeldherkenning algoritme leert te voorspellen door te kijken naar voorbeeld afbeeldingen. Tijdens dit zogenaamde deep learning trainingsproces krijgt het algoritme beelden gevoerd met daarbij de juiste categorieën of lokalisaties. Een veelgemaakte fout is het gebruik van eenzijdige beelden. Er worden dan bijvoorbeeld foto’s vanuit één camera gebruikt, of van één dag, of van één onderwerp. Dit vergroot de kans dat het model op verkeerde kenmerken gaat letten.

Voorbeeld: je traint een model voor het herkennen van lege of volle containers. Alle volle containers waren toevallig blauw. Je gebruikt je model daarna om een foto van een container te categoriseren. De container is leeg, maar ook blauw. De kans bestaat dat je model dit categoriseert als “volle container” – omdat het de kleur blauw heeft aangeleerd als onderscheidend kenmerk.

Gebruikte je een bredere beeldenset, met van iedere voorkomende kleur (min of meer) evenveel volle en lege containers, dan had het model de kleur genegeerd als onderscheidend kenmerk. En had het meer kans om de juiste kenmerken te vinden. Dit noemen we “generaliseren”: het model zal minder gericht zijn op kenmerken die er niet toe doen.

Zorg dat je altijd feedback ontvangt van een model in productie.

Iedereen maakt fouten… het gaat erom dat je ervan leert, nietwaar? Dit geldt ook voor beeldherkenning. Als het goed is gebruik je een brede, representatieve beeldenset. Toch zal het model fouten maken. Het is belangrijk om die gevallen te verzamelen. Het model kan namelijk goed leren van afbeeldingen waar het moeite mee had.

De foute afbeeldingen voeg je toe aan je beeldenset. Daarna wordt het model op-ieuw getraind. Dankzij de nieuw toegevoegde beelden kan het weer iets beter zoeken naar de onderscheidende kenmerken. En leert het iets beter te generaliseren.

Het resulterende nieuwe model gaat weer naar productie, waar het vervolgens minder fouten zal maken. Dit was één rondje door je feedback loop. Zorg dat je er veel maakt!

Zorg voor een iteratieve werkwijze die je model doorlopend verbetert.

Het is logisch dat veel aandacht uitgaat naar de prestaties van een model. Maar het tot stand brengen en automatiseren van je feedback loop is eigenlijk veel belangrijker. Waarom? Simpel: zelfs al kun je starten met een zeer sterk presterend model, de kans is groot dat het een keer minder gaat presteren.

Want de wereld verandert! Je beelden komen ineens ergens anders vandaan. Andere context, andere omgeving. Of hardware verandert. Minder kleuren, of juist meer. Scherper. Of waziger. Verandering is onvermijdelijk bij beeldherkenning, helemaal als je het op grote schaal (multi-device monitoring) toepast.

Daarom kun je maar beter klaar zijn om in te blijven spelen op veranderingen. Met een feedback loop en een iteratief trainingsproces ben je dat.

Wacht niet met het uitrollen van je beeldherkenning algoritme – gebruik het zo snel mogelijk.

Hoe eerder je model in productie ‘draait’, hoe beter. Je weet inmiddels het belang van de feedback loop en een iteratief proces. Het blijft echter aantrekkelijk om lekker door te bouwen aan dat eerste model… Misschien hoop je dat het zo goed wordt, dat je gewoon in één keer klaar bent.

Dat gaat helaas niet gebeuren. Sterker nog, als je blijft focussen op de prestaties van je eerste model, en te hoge eisen stelt, dan ga je misschien nooit de Proof of Concept voorbij. Blijf je lekker droogzwemmen. Zoals ~90% van alle A.I. projecten…

Precies daarom moet je zo snel mogelijk live. Pas dan word je gedwongen om de boel goed in te richten. Daar zal dan alsnog wel wat tijd overheen gaan. Maar je bouwt wel een model dat presteert in de echte wereld. Je bent klaar voor de praktijk: nieuwe omstandigheden en veranderende prestaties. En je behoort tot een select gezelschap dat het AI PoC stadium voorbij is.

Bepaal zo snel mogelijk de haalbaarheid en de kwaliteit van AI voor jouw situatie.

Begin je beeldherkenning project met een Prototype. Dit dwingt je namelijk om direct praktisch na te denken over je data. Welke data hebben we eigenlijk? En wat is de kwaliteit? Is de data representatief en breed genoeg (tip #2)?

Wij starten vrijwel alle projecten met een prototype. Elke situatie is weer anders, en het prototype is de snelste, goedkoopste en beste manier om vast te stellen of en hoe AI van waarde kan zijn in jouw specifieke situatie.

Intake: advies en kostenindicatie

Hopelijk heb je wat meer zicht op wat beeldherkenning kan opleveren. Maar minstens zo belangrijk: welke kosten kun je verwachten? 

De kosten van een beeldherkenning project worden voor een groot deel bepaald door de data die beschikbaar zijn. Heb je zelf beelden beschikbaar waarmee het model getraind en getest kan worden? Zijn er voldoende beelden beschikbaar? En zijn die beelden ‘representatief’, oftewel, geven ze een realistische weergave van wat er in de praktijk aan beelden voorbij komt?

Wij helpen je graag verder met een kosteloos, vrijblijvend advies en indicatie voor jouw project. Vul het onderstaande formulier in om zo snel mogelijk ons advies te ontvangen:

    Doelstelling:

    Dataset: