Open source dataset voor beeldherkenning Nederlandse vissoorten

Vandaag publiceren wij AFFiNe – Angling Freshwater Fish Netherlands, een openbare dataset met afbeeldingen en annotaties van 30 Nederlandse vissoorten voor het trainen van beeldherkenning van vissen met Machine Learning.

De dataset bevat ruim 7.000 afbeeldingen van 30 zoetwater vissoorten
in Nederland, geannoteerd voor classificatie en object detectie. 

Beeldherkenning Nederlandse vissoorten - benchmark confusion matrix

Licentie en gebruik

Deze dataset is gepubliceerd onder een open source “CC BY-NC-SA 4.0” licentie en mag gebruikt worden voor non-commerciele doeleinden, zoals publiek natuuronderzoek, Machine Learning studies en experimenten.

Herkomst en verwerking

De dataset is afkomstig van het sportvis platform SVR en werd verzameld en gevalideerd met behulp van citizen science. Gebruikers gaven toestemming voor het gebruik van afbeeldingen. We deden het volgende om privacygevoelige informatie te beschermen:

  1. Gezichtsvervaging – gezichten zijn onherkenbaar gemaakt.
  2. Uitsnijding – vissen zijn uit de originele foto’s gesneden.

Kwaliteit en validatie

De dataset is verzameld en gevalideerd met citizen science inspanningen.
Daardoor kan het onverhoopt verkeerde klassificaties bevatten. Als je expert feedback hebt op bepaalde afbeeldingen, dan horen we graag van je.

Voorbeeld en benchmark training

Bij de dataset vind je ook een notebook met een eenvoudige trainingsroutine
als voorbeeld en benchmark.

Bekijk en download de dataset op Kaggle.

Verbeter jij de benchmark?