Waarom dit handboek?
6. Next level: Linked open data
Om de meerwaarde van open data ten volle te benutten is het cruciaal dat (lokale) overheden de extra mile gaan en data niet enkel opstellen maar ook linken (zie Hoofstuk 2.1 voor een beschrijving deze basisbegrippen). Dit hoofdstuk gaat daarom dieper in op het creëren van linked open data.
Om dit mogelijk te maken moet je data op een manier beschrijven waardoor er makkelijk links aan toegekend kunnen worden. Dit wil zeggen dat we data moeten opdelen in hun kleinste, meest atomaire delen. Wanneer je bijvoorbeeld een lijst hebt van parkeergarages in een stad of gemeente met een hoop informatie zoals het adres, het aantal plaatsen, de openingsuren, de locatie van de in- en uitritten, de tarieven, of er publieke toiletten zijn enzovoort, kan je al deze data ook beschrijven in korte ‘zinnetjes’. Je beschrijft de data dan bijvoorbeeld met uitspraken als ‘Parking 1 heeft 134 plaatsen’, ‘Parking 1 heeft een rolstoeltoegankelijk toilet’ of ‘Parking 3 heeft als adres Sint-Pietersplein 1’. Elk zinnetje bestaat uit een onderwerp, gezegde en een voorwerp (subject, predicate en object in het Engels). Het verband met taal wordt hier meteen duidelijk: het gaat om een semantische manier van data beschrijven. Vervolgens wordt aan elke uitspraak een link op het web toegewezen. Voor een hele hoop uitspraken bestaan er vandaag al zogenaamde vocabularia. Deze maken het mogelijk om voor typische uitspraken zoals ‘is een’ of ‘heeft een’ dezelfde webadressen te gebruiken. Ook voor een hele hoop objecten zijn er vocabularia beschikbaar, bijvoorbeeld om te beschrijven wat een stedelijke parkeergarage of een rolstoeltoegankelijke parkeerplaats is.
Om linked data te kunnen publiceren zijn dus twee basiszaken nodig:
- de data worden beschreven op hun meest atomaire niveau;
- aan elk item wordt een link op het web toegekend die zowel voor mens als machine verstaanbaar is.
Deze manier van data publiceren heeft een aantal duidelijke voordelen. Als we teruggrijpen naar het vijfsterrenmodel uit het vorige deel, worden data tot en met het derde niveau op het web gepubliceerd: een CSV-bestand wordt op een webpagina gepubliceerd onder een open licentie en kan door eenieder gedownload en (her)gebruikt worden. Maar vanaf de vierde ster wordt het mogelijk om data bij wijze van spreken in het web te publiceren: de data zijn integraal ‘linkbaar’ met andere data, waardoor – voorlopig in theorie – alle kennis op het web als contextinformatie gebruikt kan worden.
Deze aanpak is ook heel schaalbaar, net als het web zelf: omdat er enkel webpagina’s met data gepubliceerd dienen te worden en de verwerking of visualisatie van de data bij de eindgebruiker gebeurt, is er geen zware serverinfrastructuur nodig die ervoor moet zorgen dat complexe vragen naar de data snel en efficiënt beantwoord raken. Wanneer je als gebruiker van een routeplannerapplicatie in een linked data-wereld bijvoorbeeld naar een parkeergarage geleid wil worden die dicht bij een museum ligt, waar momenteel nog plaats vrij is en waar een rolstoeltoegankelijk toilet is, volgt die app enkel de links op het web om deze informatie op te vragen en je een route voor te stellen. Het maakt het voor een overheid dus ook relatief goedkoop om data te publiceren. Er is niet per se een datapublicatieplatform nodig dat bepaalde data ontsluit; het web is het platform.
Omdat er telkens links op het web gevolgd worden, is het ook veel makkelijker om altijd over up-to-date gegevens te beschikken. Wanneer er iets verandert aan de data, zoals een parkeertarief, volgt de applicatie de link en haalt die de meest recente informatie op. Maar ook wanneer er in real-time data gepubliceerd worden, zijn linked data erg nuttig, zoals bijvoorbeeld de bezetting van een parkeergarage die elke 30 seconden gepubliceerd wordt.
Hoewel de oplossing van webadressen technisch gezien niet per se de meest uitdagende is, is dat wel het geval voor wat het beheer van linked data betreft. Een openstaande kwestie is namelijk hoe om te gaan met het toekennen van een webadres: welke organisatie is hier verantwoordelijk voor en hoe maken we goede afspraken over heel Vlaanderen, België en de wereld om ervoor te zorgen dat webadressen correct toegewezen worden? De Vlaamse Overheid maakt alvast een eerste aanzet die ze heeft vastgelegd in de Vlaamse URI-strategie. Bovendien gaven we in hoofdstuk 2 aan dat een van de principes van open data is om zo dicht mogelijk bij de bron en dus decentraal data te publiceren. Linked data is een krachtige technologie om dit mogelijk te maken en bovendien op een zeer schaalbare en kostenefficiënte manier. Maar vandaag blijft het vraagstuk omtrent het toekennen van webadressen niet volledig opgelost.
Dit weerhoudt verschillende overheden er niet van om aan de slag te gaan met linked open data: de potentiële voordelen maken het de moeite waard om deze uitdaging verder aan te gaan. Een zekere pragmatiek is dus wel te verantwoorden. Vooral voor bestaande datasets kan de omschakeling naar linked data een investering vragen die op korte termijn een te beperkte winst zal opleveren. Maar voor authentieke bronnen, basislijsten en nieuwe databronnen kan linked open data wel winsten opleveren. Het Centraal Referentieadressenbestand (CRAB) van de Vlaamse Overheid is vandaag bijvoorbeeld beschikbaar als linked open data. Een ander belangrijk project van de Vlaamse Overheid wordt aan het einde van dit hoofdstuk in meer detail toegelicht: Lokale Besluiten als linked open data (LBLOD) mikt erop om alle besluiten van lokale overheden als linked open data ter beschikking te stellen. Op die manier kan er makkelijk een link gelegd worden naar elke beslissing die een lokaal bestuur neemt, een enorme basisbron van informatie.
Voor authentieke bronnen en andere basislijsten die vaak geconsulteerd, geüpdatet en gedeeld worden, kunnen linked data dus een enorme meerwaarde betekenen. En zeker voor de aanmaak van nieuwe databronnen strekt het tot aanbeveling ten minste de mogelijkheden grondig te onderzoeken om de data als linked data te beschrijven. Hoe meer linked data er beschikbaar zijn, des te rijkere en interessantere toepassingen mogelijk zijn.
Ga naar het vorige hoofdstuk
Je kan hieronder het vorige of een ander hoofdstuk van het handboek ‘Open Data voor lokale besturen’ vinden.
De belangrijkste begrippen en het Open Data Charter
Welke meerwaarde kent open data?
Een stappenplan om van start te gaan
Wat verdient extra aandacht?
Startpagina van het handboek