2019 Tendencias de inteligencia de negocios
La administración de datos converge con las plataformas de BI modernas
El curado de datos gobernados cierra la brecha entre los datos y los negocios.
A medida que las fuentes de datos se vuelven más complejas, diversas y numerosas, la administración de datos ahora es aún más crítica en las implementaciones de BI modernas. A medida que una mayor parte de la fuerza laboral utiliza datos para tomar decisiones, las organizaciones deben garantizar la precisión dentro de sus datos y su uso en el análisis.
Las organizaciones han recurrido al curado de datos para abordar los desafíos de administración y gobernanza de datos que vienen con este acceso más amplio a los datos. El curado de datos abarca la forma en que una organización capta, limpia, define y alinea datos dispares. Este proceso crea un puente entre los datos y sus aplicaciones en el mundo real.
Las organizaciones ya están gastando millones de dólares en tecnologías que integran definiciones de datos con herramientas de análisis que ayudan a analizar los datos, con el objetivo de eliminar la ambigüedad entre equipos y organizaciones. En respuesta, las herramientas y los procesos de curado de datos (como los catálogos de datos y la gobernanza semántica) convergen con las plataformas de BI para enlazar los datos con el contexto del negocio.
Un catálogo de datos actúa como un glosario de negocios empresarial de fuentes de datos y definiciones de datos comunes. Los expertos en la materia, como los ingenieros de datos y los administradores de datos, pueden agregar descripciones y definiciones a las fuentes y campos de datos, etiquetarlas para mejorar la capacidad de detección e incluso emplear útiles indicadores de calidad de datos, incluidas las notificaciones de certificaciones de contenido confiable, o el mantenimiento o la desaprobación de los activos de datos.
Los usuarios cotidianos no necesitan saber dónde se alojan los datos en la fuente de datos, pero sí necesitan entender lo que representan los datos en el mundo real. Por ejemplo, los analistas y consumidores de contenido a menudo necesitan verificar el origen de un dato (también conocido como análisis de linaje). Y si los conjuntos de datos cambian, los ingenieros de datos y los administradores de datos deben analizar el impacto posterior de los activos conectados a las tablas o esquemas que administran. La combinación de un catálogo de datos y la plataforma de BI ayuda a simplificar todas estas tareas, proporcionando métricas de uso para identificar rápidamente los orígenes de datos y los dashboards de acceso más frecuente.
Si bien los catálogos de datos podrían ser necesarios, se podría decir que existe una mayor oportunidad más allá de la gobernanza de metadatos en el área de la gobernanza semántica. La semántica ayuda a relacionar no sólo el contexto de los datos, sino también la intención de las acciones analíticas, como la asignación de sinónimos para conectar comandos como "tamaño del pedido" con "cantidad". Esto permite nuevas modalidades para que el espectro completo de trabajadores de datos interactúe con los datos y llegue rápidamente a nuevos conocimientos. Una forma es a través de interacciones de lenguaje natural, donde una plataforma de BI comprende capas que involucran múltiples consultas, como "resaltar lo más alto, lo más bajo y lo promedio".
A medida que estas tecnologías y procesos continúan convergiendo, el curado de datos y la semántica proporcionarán una base más sólida para el resto de la experiencia de análisis. Esto unificará más componentes dispares del ecosistema de datos, como la limpieza y el análisis posterior, y generará recomendaciones más sólidas generadas por máquinas para tablas, uniones de columnas y modelos de datos. En última instancia, los avances en el curado de datos permitirán que la fuerza laboral vaya más allá de sólo hacer preguntas de sus datos durante el análisis, hacia hacer preguntas sobre su negocio.