Gebruik van algoritmische toepassing en ethiek


Inleiding

Gaat gegevensmanagement over het uitnutten van gegevens? Nee, maar gegevensmanagement gaat wel over afspraken over het gebruik van gegevens, en daar valt een visie op het gebruik van algoritmische toepassingen en ethiek wel onder.

Definities

De volgende definities worden in dit artikel gehanteerd:

Algoritmische toepassing

Software waarmee op geautomatiseerde wijze voorspellingen worden gedaan, besluiten worden genomen en/of adviezen worden gegeven door gebruik te maken van data-analyse, statistiek en/of zelflerende logica.

Ethiek

Een wetenschap waarbij wordt geprobeerd om bepaalde handelingen als goed of fout te kwalificeren. Daarnaast wordt er gekeken naar de beweegredenen van bepaalde handelingen. Zie ook: Tactisch katern gegevensmanagement – basisprincipes voor gegevensmanagement, principe 2.

Datagedreven werken

Datagedreven werken is het op basis van onbewerkte feiten en data een beweging op gang krijgen naar meer inzicht, kennis en gefundeerde beslissingen. In de volle breedte van het bedrijf. Teneinde een datagedreven organisatie te realiseren waar iedereen op basis van betrouwbare data beslissingen neemt.

Scope

De scope beperkt zich tot het ondersteunen van het uitnutten van data vanuit gegevensmanagement met algoritmische toepassingen. Hierbij komen al snel ethische vraagstukken aan bod, daar kunnen we handvatten voor meegeven.

Er zijn grofweg drie vormen van algoritmische toepassingen te onderscheiden:

  • Eenvoudige beslisboom;
  • Machine learning;
  • Deep learning (geavanceerde variant van machine learning).

De ethische vraagstukken doen zich met name voor bij varianten 2 en 3. Daarom is gekozen om het gebruik van eenvoudige beslisbomen buiten beschouwing te laten.

Dit artikel schrijft niet voor op welke wijze een ethische afweging dient te worden gemaakt. Wel biedt het handvatten door methodieken aan te reiken en enkele thema’s te benoemen waarover in het kader van ethiek moet worden nagedacht.

Aan de slag met het analyseren en combineren van gegevens

Dit artikel is geschreven vanuit de gedachte dat je aan het begin staat van het gebruiken van gegevens omwille van datagedreven sturing voor jouw organisatie.

Met de huidige gegevens kun je nog niet veel beginnen: het zijn slechts ruwe, niet verbonden gegevens waar je nog niet van weet wat de kwaliteit van gegevens is, hoe deze verbonden zijn en of er een verbinding is tussen de grote hoeveelheid van verschillende gegevens die jouw organisatie tot haar beschikking heeft.

Laten we er vanuit gaan dat je het GEMMA-framework voor gegevensmanagement volgt en minimaal het eigenaarschap, de regie en het overzicht over gegevens hebt ingericht en dat je weet welke gegevens je gaat gebruiken, wat de kwaliteit hier van is en dat je deze gegevens mag gebruiken van de bronhouder.

In het rapport VNG/Berenschot vind je meer informatie over hoe je de organisatie kunt klaarstomen voor het breder gebruiken van gegevens omwille van datagedreven sturing.

Dan blijft er over: het verbinden van gegevens door middel van een slimme rekensom, en het wel of niet kunnen uitleggen of deze verbinding en de conclusies die je verbindt aan de combinatie van gegevens toelaatbaar zijn. Oftewel: een algoritmische toepassing en de ethische vraag over het gebruik van deze gegevens.

Het ethische vraagstuk komt om de hoek op het moment dat er beslissingen worden genomen met behulp van een algoritmische toepassing. Bijvoorbeeld als er voorspellende analyses worden gedaan op mogelijke fraude of bijvoorbeeld combinaties van gegevens worden gemaakt die voor andere doeleinden zijn verzameld. De risico’s zitten niet zo zeer in het algoritme zelf, maar in de toepassing van het algoritme en de gebruikte data.

Er is een aantal overheidsrichtlijnen verschenen die in dit verband relevant zijn om te noemen:

Enkele voorbeelden van documenten en frameworks die op dit gebied verschenen en die deze discussie raken of handvaten bieden bij de vragen die er op dit gebied leven, zijn:

Onderwerpen die vanuit ethische vraagstukken geraakt worden

Er is een aantal onderwerpen te onderscheiden waaruit controls kunnen volgen gerelateerd aan ethische vraagstukken. Dit zijn:

Proces

  • Governance en eigenaarschap
  • Ontwerp
  • Inkoop
  • Beheer en onderhoud
  • Auditing

Thema

  • Privacy
  • Security
  • Archivering/verantwoording
  • Eerlijk algoritme
  • Open data
  • Jurisprudentie

Als een gemeente aan de slag gaat met algoritmische toepassingen, dan is het verstandig om er vanuit al deze perspectieven naar te kijken en de inhoudelijk deskundigen op deze deelgebieden tijdig aan te haken.

Governance en verantwoordelijkheden

Dit onderwerp gaat over rollen en verantwoordelijkheden. Een belangrijke rol is weggelegd voor de verantwoordelijke voor het gebruik van de algoritmische toepassing. Deze rol is er voor verantwoordelijk dat de relevante kwaliteitsaspecten worden meegenomen in het ontwerp van een algoritmische toepassing, de rollen ten aanzien van het beheer zijn ingevuld en dat er processen zijn ingericht van waaruit wordt gestuurd op de correcte ontwikkeling en gebruik van een algoritmische toepassing.

Ontwerp

Het ontwerpen van een algoritmische toepassing gaat niet alleen over de functionele werking, het gaat ook over het inregelen van diverse kwaliteitsaspecten en het opzetten van de beheerprocessen. De ontwerpfase is bij uitstek het moment om verschillende deskundigen te betrekken om zo tot een integraal ontwerp te komen.

Inkoop

Wanneer een product of dienst ten aanzien van een algoritmische toepassing wordt ingekocht, is het van belang om heldere afspraken vast te leggen met de betreffende externe partij. Beschikbaar framework: Modelbepalingen voor gemeenten voor het rechtvaardig gebruik van Algoritmische toepassingen - ontwikkeld door Gemeente Amsterdam i.s.m. KPMG en Pels Rijcken

Beheer en onderhoud

Nadat een algoritmische toepassing in gebruik is genomen, is monitoring van correcte werking nodig. De toepassing kan zich bij vormen van machine learning ontwikkelen, waardoor het nodig is om periodiek te toetsen of de algoritmische toepassing zich nog gedraagt zoals beoogt. Ook kan de scope wijzigen doordat een algoritmische toepassing voor andere doeleinden wordt ingezet of doordat er met andere of nieuwe gegevens wordt gewerkt. Bij dergelijke scopewijzigingen, zal opnieuw naar de verschillende kwaliteitsaspecten gekeken moeten worden. Hiervoor zijn beheerprocessen nodig zoals een wijzigingenproces.

Auditing

Met auditing wordt in deze context bedoeld het achteraf toetsen van een algoritmische toepassing op normen, kaders en wetgeving. Een audit kan gaan over het proces (bijvoorbeeld gericht op rechtmatige inkoop) en/of over een of meerdere kwaliteitsaspecten (bijvoorbeeld een beveiligingstoets of een archiefinspectie).

Privacy

Bij het verzamelen van trainingsdata waarmee een algoritmische toepassing wordt gevoed, is het belangrijk om naar de privacyaspecten te kijken. Daarbij gaat het niet alleen om het anonimiseren of pseudonimiseren als blijkt dat er persoonsgegevens in deze data aanwezig zijn. Contextuele informatie kan in sommige gevallen tot individuen herleid worden, ook daar is aandacht voor nodig.

Beveiliging

Door adequate beveiligingsmaatregelen te nemen, kan worden voorkomen dat de werking van een algoritmische toepassing negatief wordt beïnvloed door ongeautoriseerde of onbedoelde activiteiten. Het afschermen van niet-openbare gegevens behoort eveneens tot het aandachtsgebied van beveiliging.

Archivering/verantwoording

Archivering zorgt er voor dat een overheidsinstelling verantwoording kan afleggen over het gebruik van een algoritmische toepassing. Niet alleen op korte termijn, maar ook op langere termijn. Dit gaat over het bewaren en toegankelijk maken van de verschillende componenten van een algoritmische toepassing: trainingsdata, output, de logica (datamodel en rekenregels) en de documentatie over ontwerp, beheer en gebruik. De wijze van archivering is afhankelijk van de potentiële impact van het gebruik van een algoritmische toepassing op individuen en groepen mensen. In de Gemeentelijke Selectielijst 2020 is een bewaarplicht voor algoritmes opgenomen. Beschikbaar framework: Handreiking duurzame toegankelijkheid algoritmes – ontwikkeld door het Kennisplatform Informatie en Archief.

Eerlijk algoritme

Het thema ‘eerlijk algoritme’ behandelt het tegengaan van geautomatiseerde discriminatie. Data kunnen objectief en subjectief zijn. Een voorbeeld van objectieve data is het aantal ingeschreven inwoners per provincie op een gegeven moment in de tijd: dit zijn neutrale feiten die niet ter discussie kunnen worden gesteld. Een voorbeeld van subjectieve data is een database met gegevens over belastingfraudeurs. In dit voorbeeld kan de vraag worden gesteld hoe deze gegevens zijn verzameld, hier zou bijvoorbeeld profilering aan de orde kunnen zijn. Het zijn geen neutrale feiten, maar gegevens die zijn verzameld op basis van beleidsmatige keuzes en menselijke inschatting. Deze subjectiviteit kan de uitkomst van verdere verwerking beïnvloeden. Het is daarom belangrijk om de herkomst en inhoudelijke kwaliteit van gegevens in kaart te hebben. Beschikbaar framework: FairTrade Methodiek –ontwikkeld door Rik Helwegen i.s.m. Amsterdam en CBS.

Open data

Het thema ‘open data’ gaat over de afspraken ten aanzien van het delen van data. Dit gaat enerzijds over het actief openbaar maken middels open data en anderzijds over passieve openbaarmaking op basis van de Wob of in de toekomst openbaarmaking op basis van de Woo.

Jurisprudentie

Naast algemene wetgeving als AWB, AVG en Archiefwet, is voor algoritmische toepassingen jurisprudentie van groot belang. Het gebruik van algoritmische toepassingen in de publieke sector is juridisch nog een relatief onontgonnen terrein. Jurisprudentie, zoals de uitspraak in de kwestie SyRI geeft nadere duiding aan het juridisch kader.