Een opkomende beeldherkenningstechniek kan het trainen van beeldherkenning modellen gemakkelijker maken. Met een dataset die groot genoeg is, kan zo’n model zonder aanwijzingen zelf leren wat de relevante objecten in een afbeelding zijn. Traditionele dataset annotatie, zoals het tekenen en labelen van vakjes, is hiermee misschien niet meer nodig – en voorspellingen worden mogelijk zelfs beter.
Om vast te stellen of dit inderdaad het geval is, onderzoeken we deze techniek binnen het steurherkenning project. In dit artikel alvast een voorproefje.

In het plaatje hierboven zie je wat wij zien, een mooie klein zeeltje, en wat het model beschouwt als de relevante pixels om een voorspelling mee te doen.
Allereerst is het prachtig om te zien hoe de echte viskenmerken zoals het hele lijf van kop tot staart, en de vinnen worden gevonden. De hand, vingers en overige achtergrond details verdwijnen bijna volledig.
Maar er is nog iets wat dit extra bijzonder maakt. Niemand heeft dit model namelijk verteld wat een vis is.
Er zijn geen classificaties gedaan, geen kadertjes getrokken. Traditioneel moeten data scientists zulke trainingsinput handmatig samenstellen. Vaak door in heel veel foto’s heel precies vakjes te trekken, en die te labelen.
Voor dit model gebruikten we een opkomende deep learning techniek die steeds beter in staat is om, zonder menselijke annotaties, zélf de relevante gebieden in afbeeldingen te vinden.
Deze techniek maakt het starten van een beeldherkenningsproject een stuk laagdrempeliger. Er wordt een hoop tijd en moeite bespaard die normaal zou gaan zitten in het annoteren van de afbeeldingen.
Dataset en techniek
Wat je nodig hebt om dit te laten werken is onder meer een grote dataset. Wij trainden dit model met onze dataset met visfoto’s afkomstig van Vangstenregistratie.nl. Het model leert hiermee zelf de patronen van “vis” te herkennen.
Met deep learning technieken kunnen we de kennis in dit model vervolgens gebruiken om met deze of een andere dataset een nieuw model te trainen dat specifieke vissoorten in een beeld kan herkennen.
Het vermoeden is dat deze modellen, naast dat ze gemakkelijker te trainen zijn, ook betere prestaties opleveren dan modellen met traditionele annotaties.
Dat komt onder meer omdat deze modellen een veel gedetailleerder ‘begrip’ hebben van een afbeelding. Voor natuurherkenning is dit extra interessant, vanwege de uitdaging van sterk gelijkende soorten.
Om dit te onderzoeken, bouwen we op deze manier een model voor het herkennen van steuren binnen het steurherkenning project (zie inzet). De prestaties van dat model gaan we vergelijken met andere modellen die zijn getraind zijn met de ’traditionele’ technieken.
Steurherkenning project
Verschillende steursoorten lijken erg op elkaar, wat determinatie voor mensen maar ook voor AI een uitdaging maakt.
In het steurherkenning project, deel van ons Natuurherkenning thema, zoeken we naar de mogelijkheden en grenzen om steursoorten te determineren met AI.