Beheerde dataconservering overbrugt de kloof tussen data en bedrijfsvoering.
Naarmate databronnen steeds complexer en diverser worden, en steeds vaker voorkomen, is databeheer nu nog crucialer in moderne BI implementaties. Naarmate medewerkers steeds vaker data gebruiken bij hun besluitvorming, moeten organisaties ervoor waken dat hun data en de toepassing ervan in analyses kloppen.
Organisaties richten zich in toenemende mate op dataconservering om de uitdagingen binnen databeheer en -governance die ontstaan door de steeds bredere toegankelijkheid van data, het hoofd te bieden. Dataconservering omvat de wijze waarop een organisatie uiteenlopende data vastlegt, opschoont, definieert en rangschikt. Dit proces slaat een brug tussen de data en de daadwerkelijke applicaties ervan.
Organisaties geven momenteel al miljoenen uit aan technologie waarmee datadefinities worden geïntegreerd in de analysetools voor het beter analyseren van data. Dit met als doel het wegnemen van alle onduidelijkheid binnen teams en organisaties. Als reactie hierop komen de tools en processen voor dataconservering (zoals datacatalogi en semantische governance) bij elkaar op BI-platformen voor het koppelen van data aan bedrijfscontext.
Een datacatalogus fungeert als een zakelijke bedrijfswoordenlijst van databronnen en algemene datadefinities. Experts in het vakgebied, zoals data-engineers en data-stewards, kunnen beschrijvingen en definities toevoegen aan databronnen en -velden, tags aanbrengen voor een betere zichtbaarheid, en zelfs nuttige aanduidingen invoegen over datakwaliteit, waaronder meldingen voor certificering van vertrouwde content, of onderhoud of veroudering van datamiddelen.
Dagelijkse gebruikers hoeven niet te weten waar de data zich bevinden in de databron, maar ze moeten wel begrijpen waar die data voor staan in de echte wereld. Analisten en consumenten van content moeten bijvoorbeeld regelmatig de oorsprong van bepaalde data verifiëren (dit wordt ook wel afkomstanalyse genoemd). En als er datasets veranderen, moeten data-engineers en data-stewards verderop in het proces de impact ervan op assets die zijn gekoppeld aan de tabellen of schema's die hiermee worden beheerd, analyseren. Het combineren van een datacatalogus en BI-platform helpt met het stroomlijnen van al deze taken en biedt gebruiksmetriek om snel te kunnen bepalen welke databronnen en dashboards het vaakst worden gebruikt.
Datacatalogi zijn weliswaar noodzakelijk, maar toch liggen er wellicht grotere kansen voorbij de governance van metadata, namelijk op het gebied van semantische governance. Semantiek kan niet alleen helpen om de context van data, maar ook de intentie van analytische acties te koppelen, zoals het toewijzen van synoniemen om opdrachten als 'ordergrootte' aan 'aantal' te koppelen. Hiermee kunnen nieuwe modaliteiten voor het volledige spectrum van datapersoneel communiceren met data en snel nieuw inzicht verwerven. Dit kan natuurlijk via natuurlijk taalinteractie, waarbij een BI-platform meerlaagse query's begrijpt, zoals 'Markeer de hoogste, laagste en gemiddelde waarden'.
Naarmate deze technologieën en processen steeds meer samenkomen, gaan dataconservering en semantiek een steeds sterke basis vormen voor de verdere analytische ervaring. Dit draagt bij aan de eenwording van steeds meer verschillende componenten van het ecosysteem aan data (zoals het opschonen en analyses verderop in het proces) en de verdere ontwikkeling van steeds sterkere wordende, automatisch gegenereerde aanbevelingen voor tabellen, joins en datamodellen. Uiteindelijk zal de vooruitgang in dataconservering medewerkers in staat stellen om tijdens analyses niet alleen vragen te stellen over hun data, maar ook over hun bedrijfsvoering.