Organisaties zijn net mensen als het gaat om verzamelen. Bewust of onbewust worden heel veel data bewaard. Steeds meer toepassingen en apparatuur creëren bergen aan logdata die ergens worden weggeschreven. Volgens Statistica werd vorig jaar wereldwijd 149 zettabyte aan data opgeslagen. Zo’n 65 procent daarvan wordt na opslag nooit meer gebruikt. Dark data worden die vergeten gegevens genoemd. Bij organisaties gaat het bijvoorbeeld om data uit productieprocessen, bedrijfskennis in documentatie of financiële gegevens.
AI schiet te hulp
Net zoals het doorspitten van mijn verhuisdozen een tijdrovend klusje is waar ik om allerlei redenen liever niet aan begin, zo was het analyseren van dark data jarenlang ingewikkeld en kostbaar. De businesscase om het te doen ontbrak omdat niet duidelijk was welke nieuwe waarde uit zo’n proces kon komen. Nu is er echter AI die dat klusje in de digitale wereld een stuk eenvoudiger kan maken. Met getrainde Large Language Models (LLM’s) en natuurlijke-taalverwerking kunnen in korte tijd petabytes aan data worden doorzocht op zoek naar waardevolle bedrijfsinzichten.
Datamanagement verlaagt risico’s
Daarbij is het wel belangrijk te onderzoeken of de gegevens die geanalyseerd gaan worden, betrouwbaar zijn. Er zijn echter tegenwoordig goede datamanagementplatformen die zorgen dat het beleid dat het management in datagovernance vastlegt, ook wordt toegepast.
Dark data bieden namelijk niet alleen een kans, maar vormen ook een risico. Ongecategoriseerde data verhogen de kans op overtreding van wet- en regelgeving, bijvoorbeeld als het gaat om privacybescherming. Ook vanuit maatschappelijk oogpunt is het belangrijk aandacht te geven aan dark data. De opslag van enorme hoeveelheden ongebruikte gegevens verhoogt immers de CO2-voetafdruk van organisaties. Inventarisatie van dark data is dus niet alleen een kwestie van beheer, maar een strategische factor voor verantwoord IT-beleid.
Met die ogen ga ik toch ook zelf eens in mijn opslag kijken. Wellicht krijg ik nieuwe inzichten bij het doorspitten van mijn historie, opgeslagen in fysieke voorwerpen of digitale kruimelspoor. Wellicht tref ik nog een compromitterende of juist inspirerende briefwisseling aan. En anders gaat een flinke opruiming vast zorgen voor een kostenbesparing bij mijn volgende verhuizing, want die komt er alweer aan.