Heb je ook wel eens het gevoel dat een rapport niet kan kloppen of dat de data in het rapport net niet geschikt is voor jouw vervolganalyse? Onze ervaring leert dat het rapport meestal wel klopt, echter worden er in de keten van brondata naar rapport bepaalde bewerkingen gedaan die niet passen bij je vraag. Met data lineage zorg je ervoor dat de overgangen van data door de verschillende fasen heen inzichtelijk blijven.
Terug naar de brondata
Data wordt met een specifiek doel beschikbaar gesteld binnen een organisatie: het afhandelen van een operationeel proces, het verschaffen van inzicht in de financiële status van het bedrijf of bijvoorbeeld het maken van strategische beslissingen. Voor het zoeken naar nieuwe inzichten wordt vaak verder gebouwd op bestaande rapporten. Wanneer je dezelfde rapporten gebruikt voor andere vragen dan kun je wel eens bedrogen uitkomen. Na verloop van tijd ontstaat er namelijk een steeds complexere opeenhoping van transformaties en bewerkingen welke lang niet altijd aansluiten bij jouw vraag. Hiermee verdwijnt het zicht op de daadwerkelijke bron van de data.
Daarmee rijzen de volgende vragen:
- Hoe is informatie in een rapport tot stand gekomen?
- Welke bewerkingsslagen en aannames zijn er gedaan?
- Hoe ziet de keten van bron tot aan rapport eruit?
- Is er informatie geaggregeerd of weg gefilterd?
- Welke mogelijkheden laat men nu liggen en welke risico’s zijn er?
Impact creëren met data lineage
Bovenstaande context zien wij vaak terugkomen bij onze projecten. Maak kennis met data lineage! Het doel van data lineage is om de transformaties van data door de verschillende processen heen inzichtelijk te houden. Vrij vertaald: het ontrafelen van de kluwen aan bewerkingen met als doel om weer een zuiver beeld van de brondata te krijgen. Dat wil zeggen, data ontsluiten in zijn volledigheid en hoogste mate van detail (granulariteit) waarbij je je bewust bent van de keuzes die gemaakt zijn in de informatieketen. Vanuit dit startpunt kunnen de juiste keuzes worden gemaakt voor het creëren van impact met data als uitgangspunt!