I trend della business intelligence per il 2019
La gestione dei dati incontra le moderne piattaforme di BI
Una data curation controllata consente di colmare il divario tra dati e impresa.
Via via che le origini dei dati diventano più complesse, diverse e numerose, la gestione dei dati diventa sempre più critica nelle moderne distribuzioni di BI. Poiché sempre più forza lavoro utilizza i dati per prendere decisioni, le organizzazioni devono garantire l'esattezza dei propri dati e del loro utilizzo nell'analisi.
Le organizzazioni si sono rivolte alla data curation per affrontare le sfide di gestione e di governance dei dati che emergono con l'accesso più ampio ai dati. La data curation comprende il modo in cui un'organizzazione acquisisce, pulisce, definisce e ordina dati diversi. Questo processo crea un ponte tra i dati e le loro applicazioni nel mondo reale.
Le organizzazioni stanno già spendendo milioni di dollari in tecnologie che integrano le definizioni dei dati con gli strumenti analitici che aiutano ad analizzarli, mirando a eliminare l'ambiguità all'interno di team e organizzazioni. Di conseguenza, gli strumenti e i processi di data curation (come i cataloghi di dati e la governance semantica) si uniscono alle piattaforme di BI per collegare i dati con il contesto aziendale.
Un catalogo di dati funziona da glossario aziendale per sorgenti dati e definizioni comuni dei dati. Gli esperti in materia, come gli ingegneri dei dati e i data steward, possono aggiungere descrizioni e definizioni alle sorgenti e ai campi di dati, oltre ad aggiungere tag e indicatori per facilitare la ricerca e migliorare la qualità dei dati, comprese le notifiche per la certificazione di contenuto sicuro, o la manutenzione e la svalutazione degli asset di dati.
Non è necessario che gli utenti comuni sappiano dove i dati risiedono nelle sorgenti dati, ma è necessario che capiscano cosa rappresentano nel mondo reale. Ad esempio, gli analisti e i consumatori di contenuti spesso devono verificare l'origine di un dato (chiamata anche lineage analysis). Se i set di dati cambiano, gli ingegneri dei dati e i data steward devono analizzare l'impatto a valle sugli asset collegati a tabelle o schemi che gestiscono. La combinazione di un catalogo di dati e una piattaforma di BI aiuta a velocizzare tutti questi compiti, e fornisce dei parametri di utilizzo per identificare rapidamente le sorgenti dati e le dashboard con il maggior numero di accessi.
Per quanto i cataloghi di dati siano necessari, la governance dei metadati nell'ambito della governance semantica offre opportunità ancora maggiori. La semantica aiuta a collegare non solo il contesto dei dati, ma l'intenzione delle azioni analitiche, come ad esempio il mapping dei sinonimi per collegare comandi come "dimensione dell'ordine" e "quantità". Questo consente a tutti coloro che lavorano con i dati di interrogarli con modalità nuove e ottenere rapidamente nuove informazioni. Ad esempio, attraverso le interazioni basate sul linguaggio naturale, dove una piattaforma di BI comprende livelli che coinvolgono più query, come "Evidenziare il più alto, più basso e medio".
Mentre queste tecnologie e processi continuano a unirsi, la data curation e la semantica offrono una base ancora più solida per il resto dell'esperienza analitica. In questo modo le componenti più disparate dell'ecosistema dei dati verranno unificate, come la pulizia e l'analisi a valle, e si svilupperanno raccomandazioni più forti generate automaticamente per tabelle, join e modelli di dati. Infine, i progressi nella data curation consentiranno non solo di porre domande ai propri dati durante l'analisi, ma anche di porre domande all'azienda.