Provinciale open data: alleen maar geo!?

Welke open data publiceren provincies?

Alle Provincies publiceren open data, maar gevoelsmatig is het alleen geo-data. In gesprekken met provincies merk ik ook dat het voor provincies vaak lastig is om andere soorten data te noemen die provincies ook in huis hebben. Op zich is dat niet heel verbazingwekkend, want veel van de publieke taken die een provincie heeft gaan over ruimtelijke ordening, infrastructuur, natuur, en milieu, en daarbij is geo-data een uiterst belangrijk hulpmiddel. Nu we in Zuid-Holland en ook elders ondersteuning bieden bij het uitbreiden van het data-aanbod, wilde ik weten hoe het precies zit.

Mijn collega Niene heeft via de API van data.overheid.nl een lijst met alle datasets die van een provincie stammen opgevraagd. Hierna kijk ik naar wat die lijst ons vertelt.

Op het eerste gezicht zijn er grote verschillen tussen provincies: sommigen publiceren heel veel (Drenthe), ander bijna niets (Flevoland).
De Provincie Utrecht lijkt ook veel te publiceren, maar dat blijkt niet helemaal te kloppen. Utrecht publiceert al hun geo-data namelijk dubbel in data.overheid.nl. Het komt daar zowel via het Nationaal Geo-Register (NGR) als via hun eigen dataportaal (dat ook het NGR importeert) terecht. Een weeffout dus, en in de volgende grafiek is daarvoor gecorrigeerd. 


Aantal open datasets per provincie, bron: data.overheid.nl

Wat kunnen we over de verschillen zeggen? Welke typen data worden gepubliceerd?

Geo-data is dominant

Eerst is er onderscheid te maken tussen data die via het Nationaal Geo-Register (NGR) in data.overheid.nl terecht komt en data die langs een andere weg komt. Alle provincies publiceren in principe naar het NGR. Andere routes om gegevens in data.overheid.nl te krijgen zijn rechtstreekse registratie in data.overheid.nl, of publicatie via een eigen regionaal dataplatform (bijv dataplatform.nl), waaruit data.overheid.nl automatisch gegevens overneemt.

Theoretisch is het NGR de plek waar alle provincies geo-data uitwisselen, ook met andere overheden. De gegevens die in het NGR voorzien zijn van een open licentie worden vervolgens als open data automatisch in data.overheid.nl opgenomen. In die zin zou het dus kunnen dat provincies veel publiceren in het NGR, en dan een kleiner of groter deel daarvan laten overnemen in data.overheid.nl. In de praktijk suggereren de aantallen dat provincies ruwweg in dezelfde verhoudingen en aantallen naar het NGR publiceren als wat in het nationaal open dataportaal terecht komt.  

Van de ruim 3000 datasets die door provincies als open data in data.overheid.nl worden gepubliceerd komen slechts 48 niet uit het NGR, ofwel zo’n 1.5%. Van de 12 provincies publiceren er 4 niets buiten het NGR om, nl. Noord-Brabant, Zeeland, Flevoland, en Overijssel.

Drenthe steekt er bovenuit in het aantal geo-datasets dat ze (via het NGR) publiceren, ruim 900. Wat ze publiceren bevat meer historische gegevens, en ze lijken veel completer te zijn in onderwerpen dan andere provincies. Het had gekund dat dit betekent dat Drenthe gewoon meer van hun bestanden in het NGR een open licentie meegeeft, maar dat is niet het geval. Ook in het NGR steekt Drenthe boven de andere provincies uit.

De middengroep publiceert zo’n 200-300 open datasets (ook in het NGR), en bestaat uit de provincies Zuid-Holland, Noord-Holland, Gelderland, Utrecht, Groningen, en Fryslan.

Overijssel valt met zo’n 500 datasets tussen die middengroep en Drenthe in.
Dit lijkt het resultaat van een meer directe en geautomatiseerde verbinding tussen het Overijssels geo-portaal en het NGR.  Overijssel publiceert doelbewust geen historische gegevens, alleen actuele, hetgeen het verschil met Drenthe deels verklaard. Als een dataset wordt bijgewerkt in Overijssel, wordt de voorgaande versie intern gearchiveerd, en niet langer extern beschikbaar gemaakt. Dat is niet in lijn met wat bij open data als good practice wordt gezien, maar op dit moment niet probleemloos aan te passen in de Overijsselse werkprocessen.

Als het geen geo is, bestaat het eigenlijk niet

Van de slechts 48 provinciale open data sets die niet uit het NGR stammen, zijn er slechts 22 (46%) niet geo-gerelateerd. De overige 26 (54%) zijn wel geo-data en zouden naar verwachting eigenlijk via het NGR gepubliceerd moeten worden. 
Over het geheel gezien betekent dit dat minder dan 1% van alle provinciale open data niet geo-gerelateerd is.

Van die 22 bestanden stamt precies de helft uit Zuid-Holland (bijvoorbeeld beeldbanken, subsidiegegevens, onkosten van bestuurders en beslissingen), en ruim een kwart stamt uit Gelderland. Die twee provincies zorgen samen voor 77% van alle provinciale open data die niet geo-gerelateerd is. 

Gelderland is de enige provincie open geo-data uitsluitend via het NGR publiceert, en zoals het hoort alleen niet geo-gerelateerde data buiten het NGR om publiceert.
Fryslan publiceert als enige een inventarislijst van de data die ze in huis hebben als open data. Dat is van de 3 niet geo-gerelateerde datasets die ze open maken.

Het staatje hieronder laat de provincies zien die buiten het het NGR data publiceren, en hoeveel daarvan geen geo-data zijn. Vier provincies publiceren zoals genoemd niets buiten het NGR.


Wat publiceren provincies buiten het NGR als open data? En wat daarvan is geen geo-data?

Als je deze aantallen vergelijkt met de beschikbare provinciale data-inventarisaties (Fryslan in 2016, en Noord-Holland in 2013), dan zie je dat de dominantie van geo-data niet vreemd is. Zo’n 80% van alle data bij provincies is geo-data. Op dit moment wordt van die geo-data gemiddeld 20-25% als open data gepubliceerd, dus zo’n 15-20% van het totaal.

Echter van alle provinciale open data is meer dan 99% geo-data. Dus hoewel slechts een klein deel van de geo-data open data is, is geo-data wel zeer oververtegenwoordigd in die open data. Deze scheve verhouding betekent dat vrijwel niets van de provinciale werkzaamheden, prestaties, beleidstaken en financiën beschikbaar is als open data, en provincies in termen van open data dus nog geheel niet transparant zijn.

Waar de kansen liggen

Om zowel het volume als de breedte van het provinciale aanbod uit te breiden zijn twee acties mogelijk en nodig.

Allereerst het fors uitbreiden van het open geo-data aanbod van provincies. De provincies hebben een duidelijk proces voor het toevoegen van gegevens aan het NGR, en het uitbreiden van geo-data in het NGR zou dus binnen de bestaande data governance-taken moeten kunnen, als het al niet geautomatiseerd is. Door in het NGR een juiste licentie te kiezen, is het publiceren van open data daar vervolgens automatisch, en de overname in data.overheid.nl gegarandeerd. Het zou dus zonder veel inspanning, en zeker zonder extra processen of taken, mogelijk moeten zijn om alle provincies qua aanbod van geo-data op het niveau van Drenthe te brengen.

Ten tweede, omdat het pad via het NGR weinig aandacht behoeft, kan de echte energie worden gestoken in open data die niet geo-gerelateerd is. Zo’n 20% van de provinciale data valt in die categorie. Deze data is veel diverser van vorm dan geo-data, met meer mogelijke hindernissen (kwaliteit, formaten, deels niet openbaar, bewerking/aggregatie nodig etc.). Niettemin blijkt uit de bestaande provinciale inventarisaties dat zo’n 90% van deze datasets in enige vorm naar buiten kan als open data.
Open data teams bij provincies zouden dus juist oog moeten hebben voor deze groep van data, na te hebben gecontroleerd of het geo-data aanbod via bestaande en automatische processen kan worden uitgebreid.

Een inventarisatie van welke gegevens in huis zijn is hier zeer nuttig (en wellicht kan de voor de AVG gescreende data en bijv. een bestaande applicatielijst hier helpen), maar ook zonder dat kun je starten. De bestaande inventarisaties zoals in Fryslan en Noord-Holland zijn prima wegwijzers: de publieke taken en dus de verzamelde gegevens, verschillen niet fundamenteel van provincie tot provincie. 

Verstop je niet achter een kaart

Kortom, maak het aanbod van open provinciale geo-data compleet. Omarm het feit dat provincies vooral geo-data hebben door data-governance en publicatie goed te automatiseren. Stop je energie verder in ‘de rest’, waar juist alle data over het functioneren van de provincie zit.

Provincies klagen vaak over het feit dat hun rol en taken binnen het huis van Thorbecke zo onzichtbaar zijn voor burgers. Maak jezelf zichtbaarder door het publiceren van niet geo-gerelateerde data. Verstop je niet langer achter stapels kaarten.

Company Details

The Green Land B.V.

Visiting address:
Kobaltweg 38
3542 CE Utrecht
The Netherlands

Company registration / KvK 60858184
VAT/BTW NL-854090770B01

Follow us on Twitter: @GreenLand_OD