Wat we AI noemen is een groep verschillende algoritmen die ontworpen zijn om wat wij als "intelligentie" beschouwen te simuleren of na te bootsen. Hoewel deze algoritmen vaak magisch lijken voor niet-ingewijden, verwerken ze voornamelijk enorme hoeveelheden gegevens om patronen of eigenschappen te identificeren. Grote taalmodellen (LLM's) bootsen bijvoorbeeld na hoe mensen taal gebruiken.
Eenvoudig gezegd is AI zo goed als de gegevens die het verwerkt. Geef het slechte of bevooroordeelde gegevens en je krijgt slechte en bevooroordeelde resultaten terug. Als een generatief AI-systeem bijvoorbeeld alleen zou worden getraind op de toespraken die ik heb gehouden in mijn minder dan perfect Engels, zou het geen hoogwaardige inhoud produceren zoals die van Oprah Winfrey of Winston Churchill - het zou mij gewoon nadoen.
Samenwerkende modellen zijn belangrijk
De opkomst van generatieve AI, geleid door toepassingen als OpenAI's ChatGPT en Microsoft's Copilot, verergert de enorme databehoefte van deze systemen. De huidige AI-engines trainen op datasets die kunnen worden gekocht of gevonden op het openbare internet, maar deze bronnen hebben hun grenzen. Wat gebeurt er als ze uitgeput zijn?
Traditionele methoden om gegevens te verzamelen naderen hun grenzen. Onderzoek suggereert dat toegankelijke gegevensbronnen volgend jaar uitgeput kunnen zijn. Bovendien heeft de praktijk van het lukraak verzamelen van gegevens geleid tot een terugslag, waarbij voorheen open datasets nu worden beperkt.
Veel andere waardevolle datasets blijven onbenut omdat ze niet strikt te koop zijn. Dit zijn datasets die individuen of organisaties onder specifieke voorwaarden willen delen:
Dit is precies wat dataruimtes mogelijk kunnen maken, dankzij het Dataspace Protocol. Het is een gestandaardiseerde set regels voor het veilig en interoperabel delen van gegevens. Om deel te nemen aan een dataruimte gebruiken organisaties een dataruimte connector: een softwarecomponent die deze regels toepast.
Zie het als e-mail: de e-mailprotocollen definiëren hoe berichten moeten worden geformatteerd en verzonden, terwijl e-mailservers en -clients de software zijn die deze protocollen daadwerkelijk implementeert om berichten te verzenden en ontvangen. Op dezelfde manier definieert het Dataspace Protocol de regels voor het soeverein delen van gegevens, terwijl dataspace connectors de software is die deze regels in de praktijk brengt.
Hoe het Dataspace Protocol werkt
Hoe helpt het Dataspace Protocol ons met AI? Het richt zich op de drie belangrijkste vereisten die ik eerder heb aangestipt:
De International Data Spaces Association leidt de inspanningen om het Dataspace Protocol tot een internationale standaard te maken. Deze standaardisatie zal nieuwe mogelijkheden creëren in verschillende sectoren door middel van een gemeenschappelijk raamwerk voor het delen van gegevens.
Dataruimtes bieden een duurzaam alternatief, ontsluiten nieuwe gegevensbronnen en zorgen tegelijkertijd voor gegevenssoevereiniteit, vertrouwen en eerlijke waarde-uitwisseling. Deze aanpak komt niet alleen tegemoet aan de onmiddellijke gegevensbehoeften van AI, maar is ook in overeenstemming met ethische en samenwerkingsprincipes.
Het Data Spaces Support Centre bevordert de ontwikkeling en toepassing van dataruimten in heel Europa. De Data Space Blueprint integreert gevestigde normen en maakt gebruik van lessen die zijn getrokken uit succesvolle implementaties. De Data Space Toolbox combineert de expertise van 12 gerenommeerde partners en maakt deze toegankelijk voor iedereen die het potentieel van een dataruimte wil benutten.
Auteur: Gianfranco Cecconi
Ontmoet Gianfranco, leer meer over het Data Spaces Support Centre en kom meer te weten over dataruimtes van een van de partners van het DSSC, de International Data Spaces Association: Data Expo, stand #86.