Beeldherkenning algoritmes worden ‘getraind’ met grote hoeveelheden foto’s, zogenaamde datasets. Foto’s van natuurwaarnemingen kunnen gezichten van personen bevatten, bijvoorbeeld wanneer iemand een plant of dier vasthoudt of aanwijst of simpelweg aanwezig is op een foto van de waarneming. VAART software ontwikkelde een tool die eenvoudig integreert in het trainingsproces en consequent gezichten onherkenbaar maakt en grote, groeiende datasets.
Gezichten vallen in de categorie ‘biometrische persoonsgegevens’, omdat een gezicht net als bijvoorbeeld vingerafdrukken een persoon kan identificeren. Sinds 2018 mogen zulke gegevens vanuit de privacywetgeving niet zomaar worden opgeslagen.
Een logische maatregel is om gezichten in datasets voor beeldherkenningsmodellen te verwijderen of onherkenbaar te maken. Maar omdat deze datasets meestal heel groot zijn, is dit handmatig niet te doen. Bovendien worden datasets, vanuit het karakter van deep learning, voortdurend uitgebreid en aangevuld. Dat maakt het moeilijk om dit consequent toe te passen en doorlopend de privacy te kunnen garanderen.
Tool voor automatische privacy
VAART software heeft een tool ontwikkeld die gezichten in foto’s onherkenbaar maakt. De tool is eenvoudig te integreren in bestaande software en uitvoerbaar op vrijwel iedere server of computer. Dit maakt het mogelijk de tool als automatische stap te integreren in het trainingsproces van beeldherkenning algoritmes.
Wij hebben de tool uiteraard geïntegreerd in ons eigen proces. In de foto’s die wij van klanten ontvangen om beeldherkenning algoritmes te trainen, zijn gezichten automatisch verwijderd voordat ze in onze werkomgeving worden opgeslagen en gebruikt.
Onze klanten kunnen de tool ook zelf gebruiken om gezichten onherkenbaar te maken vóórdat ze de foto’s aanleveren. En de toepassing kan zelfs nog een stap eerder plaatsvinden, bijvoorbeeld door de tool in een bestaande webapplicatie te integreren, waar het gezichten onherkenbaar maakt in foto’s die door gebruikers worden geüpload.
Geen kwaliteitsverlies
Door de vervaging van gezichten verandert de afbeelding. Heeft dit geen gevolgen voor de kwaliteit van de beeldherkenning? Hier is uitgebreid onderzoek naar gedaan op basis van een grote wereldwijde deep learning benchmark. Het onderzoek wees uit dat het vervagen van gezichten nauwelijks tot kwaliteitsverlies leidt in de modellen die met deze afbeeldingen getraind worden.
Waarom beeldherkenning bij natuurwaarnemingen
Citizen Science speelt een grote en groeiende rol in onze kennis van natuur. Amateurspotters plaatsen dagelijks duizenden foto’s van waarnemingen op allerlei online platforms. Daarvan wordt dankbaar gebruik gemaakt: van alle waarnemingen die onze overheid aan de EU rapporteert, is maar liefst 95% afkomstig van vrijwilligers.
Omdat steeds vaker mede op basis van natuurwaarnemingen natuurbeleid wordt gevoerd, is het belangrijk dat de waarnemingen correct zijn. Beeldherkenning kan hierbij helpen. Aan de ‘voorkant’, waar de waarnemer de soort invult, en aan de ‘achterkant’, waar de waarneming door validatoren (soortenexperts) wordt beoordeeld.
Beeldherkenning kan een waarnemer helpen de juiste soort te selecteren, en validatoren in staat stellen om sneller grote hoeveelheden waarnemingen te valideren, bijvoorbeeld door waarnemingen van specifieke soorten automatisch te beoordelen of door voorselecties en goed/fout suggesties te tonen.
Beeldherkenning en privacy
Beeldherkenning wordt steeds belangrijker voor de betrouwbaarheid van natuurwaarnemingen. Modellen voor beeldherkenning worden getraind met duizenden foto’s, die onbedoeld gezichten van waarnemers kunnen bevatten.
Met de tool van VAART software wordt de privacy van waarnemers gewaarborgd in datasets voor beeldherkenning. Alle gezichten worden vervaagd zonder kwaliteitsverlies van het uiteindelijke model.
Wil je meer weten over de tool? Laat een bericht achter via ons contactformulier.
Update: de privacy tool is nu beschikbaar als kant en klaar product.