Waarom dit handboek?
2. Wat is open data? – De basisbeginselen
Wat een eenvoudige vraag lijkt voor een mens, is soms een enorm moeilijke vraag voor een computer. Het is geen wiskundig probleem, maar eerder een uitdaging voor een ‘machine’ om te achterhalen welke gegevens (of ‘data’) ze kan gebruiken om de volgende vraag op te lossen:
Hoe ver woon jij van de dichtstbijzijnde supermarkt die op zondag open is?
Hoewel de Vlaamse open data markt reeds 2,9 miljoen euro genereert, is de vereiste data vaak nog steeds niet publiek beschikbaar in Vlaanderen. Nochtans wil een winkel haar openingsuren maximaal verspreiden, wil de wegbeheerder aan iedereen laten weten waar de wegen liggen, wil een openbaarvervoersbedrijf bekendmaken dat er een bus stopt in de buurt van jouw supermarkt enzovoort. Wie doet wat in dit verhaal? Waarom zouden we data openstellen en op welke manier pakken we dit het best aan? Dat zijn de vragen waarop we een antwoord zoeken onder de noemer ‘open data’.
Het lijkt misschien vanzelfsprekend dat data die je als overheid openstelt voor het brede publiek, een grote economische meerwaarde kunnen hebben, bijna als een onuitputtelijke ruwe grondstof. Makkelijk herbruikbare data laten iedereen toe om (her)gebruiker van de data te worden en zo nieuwe diensten te bouwen, innovatieve apps te maken, interessante visualisaties te creëren enzovoort. Deze nieuwe toepassingen kunnen commercieel van aard zijn, een publieke taak vervullen of beiden. Denk bijvoorbeeld aan een app waarmee je een digitaal toegangskaartje voor een evenement in je gemeente kunt kopen, of een website van de overheid die je op basis van luchtfoto’s inzicht geeft over de isolatie van je dak. Voornamelijk commerciële bedrijven erkennen steeds meer de waarde van data en proberen nieuwe businessmodellen uit te bouwen op basis van de verzameling, verwerking, verrijking en verkoop van data. Dit noemt men de ‘data economy’.
Naast economische meerwaarde, kan het opstellen van data ook maatschappelijke, sociale, politieke en ecologische meerwaarde creëren. Denk bijvoorbeeld aan de toenemende werkgelegenheid in de open data markt. Verder brengen toepassingen op basis van open data ook mensen samen. Zo is er in Berlijn een platform(opent in nieuw venster) dat burgers toont welke bomen in de buurt water nodig hebben. Naast mensen verenigen, helpt dit platform ook de natuur. In dit kader zijn er apps die real-time informatie over openbaar vervoer nemen om verplaatsingen met trein of bus te stimuleren en te faciliteren. Haltelink(opent in nieuw venster) gaat nog een stap verder en linkt deze informatie aan de aanwezigheid van deelfietsen in stations. Open data kan zelfs ook levens reden. Zo alarmeert EVapp(opent in nieuw venster) na een 112 oproep een hulpverlener in de buurt die sneller dan de ambulance ter plaatse kan zijn om eerste hulp te verlenen.
Open data creëert dus niet enkel meerwaarde voor bedrijven maar ook voor burgers, kennisinstellingen en overheden zelf. Voor burgers zal dit onder andere leiden tot meer welvaart door innovatieve producten en diensten, maar ook tot transparanter overheidsbeleid waarin ze in toenemende mate kunnen participeren. Kennisinstellingen kunnen op basis van open data meer onderzoek uitvoeren, wat op zijn beurt waarde zal creëren. Overheden zelf baten ook bij het openstellen van data vermits dit tijd kan besparen (denk aan administratieve kosten), maar voornamelijk omdat ze betere besluitvorming kunnen doorvoeren die op data is gebaseerd. (Voor meer informatie over de meerwaarde van open data zie hoofdstuk 3)
Om deze voordelen te bereiken via open data, kijkt men vaak in eerste instantie naar de overheid als voornaamste betrokken partij: de verschillende overheden beschikken immers over een schat aan informatie over heel wat aspecten van ons leven. Het gaat dan om persoonsgegevens (deze zijn echter nooit het onderwerp van open data – zie verder) en omgevingsinformatie zoals registers van adressen, gebouwen, nutsvoorzieningen, dienstverlening, straatmeubilair, mobiliteitsdata, weersinformatie, enzovoort. Als een overheid deze informatie op een gestructureerde en gereguleerde manier kan delen met anderen, is de potentiële meerwaarde van deze data enorm.
Weliswaar brengt deze doelstelling om data te ontsluiten complexe uitdagingen met zich mee. Het ontsluiten en onderhouden van sets van data (cfr. Duurzame open data) gaat bijvoorbeeld gepaard met bepaalde kosten. Voor een eenmalige hackathon kan je tamelijk eenvoudig een prototype maken met een dataset, maar datasets duurzaam verbinden met interne systemen vraagt tijd en jarenlang onderhoud. Als je datasets publiceert aan een lage kwaliteit, kan een (her)gebruiker moeilijker zo’n duurzame koppeling opzetten. De onderhoudskosten vergroten, terwijl de meerwaarde voor de (her)gebruiker identiek blijft. Er duiken dus snel heel wat complexe vragen op, wanneer je als overheid open data wil publiceren.
Open data publiceren is vandaag nog steeds een moeilijke evenwichtsoefening tussen technologische, economische, organisatorische, juridische en maatschappelijke uitdagingen. Wanneer we deze balans toch gevonden hebben, is de return on investment aanzienlijk, gaande van economische meerwaarde, over enorme efficiëntiewinsten in de interne organisatie, tot meer transparantie en burgerparticipatie bij complexe maatschappelijke uitdagingen (zie hoofdstuk 3). Om dit mogelijk te maken moeten overheden en organisaties (zoals ondernemingen en kennisinstellingen) onderling de juiste minimale afspraken maken. Aan de basis van deze afspraken ligt een consensus over de definities en beschrijvingen van de basisbegrippen. Zodoende geeft dit hoofdstuk een overzicht van de basisbegrippen voor open data en gaat vervolgens dieper in op de filosofie voor open data.
2.1.2 Open Data
voor ‘open data’ hanteren we de definitie van opendefinition.org(opent in nieuw venster):
“Gegevens die vrij toegankelijk zijn en die gebruikt, verwerkt en gedeeld mogen worden door eenieder en voor elk doel.”
Voorbeelden van data die opengesteld kan worden zijn adressen en openingsuren van ondernemingen, gegevens over publieke events, gegevens over mobiliteitsstromen in de stad, wegenregisters, gegevens over opleidingen, enzoverder. De afbeelding rechts geeft een overzicht van populaire datasets van Open Data in Vlaanderen.
2.1.3 Linked open data
Een van de principes van open data houdt in om data zo dicht mogelijk bij de bron (bijvoorbeeld op de website van de gemeente) en dus decentraal te publiceren. ‘Linked data’ is een krachtige technologie om dit mogelijk te maken en wel op een zeer schaalbare en kostenefficiënte manier. We spreken over ‘linked open data’ wanneer:
“gepubliceerde open data ook gekoppeld worden aan andere data via het web”
Door dezelfde domeinmodellen en identificatoren (zie verder) te gebruiken kan je sneller verbanden zien tussen verschillende gegevens en kan je data in een bredere context plaatsen. Zo kan je bijvoorbeeld het gebruik van een fietsdeelsysteem in een stad eenvoudig koppelen aan het weerbericht, of het energiegebruik aan een officiële adressenlijst.
Linked open data publiceer je op basis van vijf ‘interoperabiliteitslagen’. Deze lagen worden omschreven aan de hand van minimale technische afspraken: juridisch, technisch, syntactisch, semantisch en querying. In hoofdstuk 6 gaan we dieper in op het concept van linked open data als een geavanceerde stap nadat je als lokale overheid open data onder de knie hebt en het open data beleid wijd gedragen is.
2.1.4 Metadatering
Gezien het doel van (linked) open data om (her)gebruik van data te stimuleren is het cruciaal dat (her)gebruikers zoals andere overheden en ondernemingen of zelfs burgers de data eenvoudig kunnen terugvinden. Daarenboven zijn data ook niet altijd inzichtelijk zonder context: een tabellenreeks, ellenlange opsommingen van tijdsfragmenten of loutere cijfers spreken vaak niet voor zich. Metadatering is hierbij cruciaal. Dit komt neer op data verzamelen óver de data, bijvoorbeeld het moment waarop de data verzameld werden, het moment van updaten of de frequentie waarmee dit gebeurt, de reden waarom de data verzameld werden enzovoort. Deze contextinformatie is noodzakelijk om de data te kunnen interpreteren. Dit is ook van belang wanneer er verschillende versies van gegevensbronnen ontstaan over eenzelfde onderwerp, bijvoorbeeld een adressenbestand van handelaars. Door metadata bij te houden kan men een historiek in kaart brengen, bijvoorbeeld wanneer een bepaalde handelaar op een bepaalde locatie actief was in het verleden.
Technische voorwaarde
Naast een open licentie is ook het technische formaat van de data belangrijk. We spreken over open data als gegevens in een ‘machine-leesbaar’ en open formaat beschikbaar zijn. ‘Machine-leesbaar’ betekent dat het om gestructureerde gegevens gaat, bijvoorbeeld een tabel met gegevens, in plaats van een rapport dat de gegevens tekstueel beschrijft. Een open formaat betekent dat je de gegevens met verschillende programma’s kunt lezen in plaats van één specifiek softwarepakket. Zo is een CSV-bestand (i.e. een specifiek type tekstbestand met waarden die door een komma gescheiden zijn) een open formaat, maar een Microsoft Excel spreadsheet (i.e. Xls-bestand) is dat niet (meer informatie hierover vind je hier(opent in nieuw venster)).
In de aanbevelingen in hoofdstuk 4 wordt nog dieper ingegaan op verschillende elementen of categorieën waarmee (lokale) overheden dienen rekening te houden als ze aan de slag te gaan met open data waarin de technische voorwaarden zijn verwerkt. Verder gaat ook de online leeromgeving verder in op deze materie in lesreeks 4: Werken met data.
2.2.2 Het open data proces
Om inzichten te verkrijgen in hoe je start met open data is het goed om een globaal overzicht te hebben van het open data ecosysteem. Er zijn twee grote groepen van spelers of stakeholders in het open data ecosysteem: data ontsluiters en data (her)gebruikers. Onderstaande afbeelding geeft dit open data proces visueel weer.
Data ontsluiter
In de rol als data ontsluiter, ook wel data-publisher genoemd, hebben overheidsorganisaties twee belangrijke taken om het open data proces te initiëren en aanhoudend te bestendigen. Ten eerste zijn er overheidsorganisaties die gegevens creëren en verzamelen (cfr. datacreatie). Dit gebeurt in de dagelijkse activiteiten van het bestuur: bijvoorbeeld de opmaak van de notulen tijdens de gemeenteraad, de inventarisering van beplantingen op het openbaar domein, tellingen tijdens festiviteiten, de opmaak van bezoekersgegevens van gemeentelijke musea enzovoort. Daarnaast neemt de overheid ook de rol op om data open te stellen als (linked) open data. In die rol geeft een overheid gegevens door aan een hogere overheid, zoals het verkregen aantal subsidies aan het Departement Cultuur of de melding van de beslissing om een snelheidsaanpassing te maken in een bepaalde straat via een aanvullend reglement. Daarnaast publiceren administraties ook gegevens op hun website, bijvoorbeeld om burgers en organisaties te informeren. Dit kan gaan over de openingsuren van diensten, de data van evenementen, de samenstelling van het college van burgemeester en schepenen, beleidsplannen, tot de resultaten van de beslissingen van de gemeenteraad. We spreken van (linked) open data als de administratie bewust nadenkt over hoe ze deze gegevens ontsluit op het web, met het oog op (her)gebruik. Hiervoor verwijzen we naar de basisbegrippen uit hoofdstuk 2.1. Een voorbeeld van linked open data betreft het LBLOD-project van het Agentschap Binnenlands Bestuur (zie ook hoofdstuk 6.2).
Data (her)gebruikers
Ten tweede is er de groep van mensen en organisaties die de eerder geproduceerde gegevens opnieuw gebruiken in digitale toepassingen, de zogenaamde data (her)gebruikers of reusers. Een eenduidige afbakening is niet makkelijk. Veelal gaat het om organisaties die een digitale toepassing ontwikkelen om de gepubliceerde data over te nemen en deze in hun toepassing te implementeren. Dat zien we bijvoorbeeld wanneer gps-systemen de realtime data van het Vlaams Verkeerscentrum overnemen. Maar het kan ook om een actieve burger gaan, die met een eigen toepassing de openingsuren en fysieke toegankelijkheidsinformatie wil visualiseren op een kaart. Wat er precies met de data gebeurt en wie er wat mee doet, wordt geregeld via de licentie die je als publicerende instantie aan de data koppelt.
Een voorwaarde opdat data (her)gebruikt worden, is dat ze vindbaar zijn. Dit kan op de website van een lokaal bestuur of via een open data platform; hier komen we in hoofdstuk 4 uitgebreid op terug. Data worden dus eerst gecreëerd en gepubliceerd door de data ontsluiter en vervolgens teruggevonden en (her)gebruikt in verschillende toepassingen. In een laatste fase ontvang je als publicerende instantie feedback van de (her)gebruikers. Dit kan gaan over bepaalde onvolledigheden in de gepubliceerde data, over de kwaliteit van de gegevens, over ontbrekende elementen enzovoort. Dankzij deze feedback loop kom je als organisatie te weten door wie en hoe de ontsloten data gebruikt worden en wat ze zelf kan verbeteren.
Besturen die zelf al gegevens als open data publiceerden, geven aan dat die feedback loop aanleiding kan zijn om de interne data-activiteiten te verbeteren. Initiatieven om data open te stellen zetten ook een ontwikkelproces in gang naar een meer gestructureerd databeleid.
2.3.3 Het juridisch kader
We verwezen al eerder naar het juridisch kader dat in een aantal regelingen voor open data voorziet. Er bestaat namelijk een juridisch kader voor de publicatie van overheidsinformatie als open data. Het gaat om een Europese richtlijn, die haar oorsprong kent in 2003 als de “Public Sector Information (PSI) Directive” en die in 2019 vervangen werd door de “Open Data Directive” of “Open Data Richtlijn(opent in nieuw venster)” Deze richtlijn over het (her)gebruik van overheidsinformatie wil transparantie verhogen en eerlijke concurrentie creëren, om op Europese schaal toepassingen te kunnen bouwen met open overheidsinformatie. De richtlijn bepaalt dat bestuursdocumenten in het kader van een publieke opdracht van een overheidsinstantie maximaal open en machine-leesbare formaten moeten hanteren, een open licentie moeten hebben, en zo ter beschikking gesteld moeten worden voor (her)gebruik, zowel voor niet-commerciële als commerciële doeleinden. De Vlaamse Overheid heeft haar eigen modellicentie ontwikkeld die bepaald wie de rechten op de data behoudt en wat (her)gebruikers met de data kunnen doen.
Overheidsorganisaties die onder het toepassingsgebied van de richtlijn vallen, kunnen ook een vergoeding vragen voor het openstellen van de data, maar deze moet beperkt blijven tot de marginale kosten voor de vermenigvuldiging, verstrekking en verspreiding van de bestuursdocumenten in kwestie. Dus ook over vergoedingen voor open data is een juridische grondslag voorhanden.
Bovenstaande kader duidt op de generieke interpretatie van ‘data’. Soms komt het voor dat er specifieke regelgeving is die bepaald wat lokale besturen kunnen of moeten doen rond specifieke data. Het bekendste voorbeeld is de Europese INSPIRE Richtlijn(opent in nieuw venster) rond geo-data (i.e., geografische gegevens of ruimtelijke gegevens) en GIS-data (i.e., geometrische en geothematische data). De INSPIRE-richtlijn beoogt de oprichting van een infrastructuur voor ruimtelijke gegevens van de Europese Unie ten behoeve van het EU-milieubeleid en beleidsmaatregelen of activiteiten die van invloed kunnen zijn op het milieu. Deze Europese infrastructuur voor ruimtelijke gegevens (cfr. geo-data) zal het mogelijk maken om (1) ruimtelijke milieu-informatie te delen tussen overheidsorganisaties, (2) de toegang van het publiek tot ruimtelijke informatie in heel Europa vergemakkelijken en (3) de grensoverschrijdende beleidsvorming ondersteunen. INSPIRE is gebaseerd op de infrastructuren voor ruimtelijke informatie die door de lidstaten van de Europese Unie zijn opgezet en worden beheerd. De richtlijn heeft betrekking op 34 ruimtelijke-gegevensthema’s die nodig zijn voor milieutoepassingen. In België wordt de INSPIRE-richtlijn geïmplementeerd via het nationale portaal ‘www.geo.be(opent in nieuw venster)’ alsook via enkele andere portalen (cfr. Géoportail de la Wallonie(opent in nieuw venster), Geopunt(opent in nieuw venster), Brussels Geoportal(opent in nieuw venster), en Urban Brussels(opent in nieuw venster)). Het doel van het nationale portaal is de toegang tot de geografische gegevens van de federale instellingen en tot de bijbehorende diensten voor web toegang te centraliseren. De catalogus biedt records met INSPIRE-conforme metadata voor gegevens en diensten, en de cartografische browser classificeert de gegevens op basis van de laag (Maplayer) volgens het INSPIRE-thema of de gegevensbron.
Het juridisch kader over open data is niet overal even goed gekend. Het Open Data Charter herneemt een aantal principes uit dit kader in duidelijke taal. Om op een duurzame manier open data te gebruiken moeten de wetgeving en de onderliggende principes wel gekend zijn bij overheidsorganisaties. Zowel het charter als de wetgeving kunnen een hoop onduidelijkheden en twijfel wegnemen voor alle betrokken partijen (bv. overheden, ondernemingen, burgers, maatschappij, enzoverder). Zo bevat het vernieuwde Bestuursdecreet (2021) een verduidelijking over gegevensuitwisseling (bestuursdocumenten) in een interbestuurlijke context: het gebruik van bestuursdocumenten binnen de overheidsinstantie met andere doeleinden dan de publieke taak, en de uitwisseling tussen overheidsinstanties met het oog op de vervulling van hun publieke taak, worden niet als (her)gebruik aanzien.
Ga naar het volgende/vorige hoofdstuk
Je kan hieronder het volgende, het vorige of een ander hoofdstuk van het handboek ‘Open Data voor lokale besturen’ vinden.
Welke meerwaarde kent open data?
Een stappenplan om van start te gaan
Wat verdient extra aandacht?
Wat is de volgende stap?
Startpagina van het handboek