2019 Tendencias de inteligencia de negocios
La administración de datos converge con las plataformas de BI modernas
La selección de datos gobernada salva la brecha entre datos y negocios.
A medida que las fuentes de datos se vuelven más complejas, diversas y numerosas, la administración de datos es más importante que nunca en las implementaciones de BI modernas. Como cada vez es mayor la cantidad de personal que usa datos para impulsar la toma de decisiones, las organizaciones deben garantizar su precisión y su uso en los análisis.
Además, las empresas recurren a la selección de datos para superar desafíos relacionados con la administración de datos y la gobernanza que trae aparejado el acceso más generalizado a los datos. La selección de datos incluye la forma en que una organización captura, limpia, define y alinea datos diversos. Ese proceso crea un puente entre los datos y los usos en la vida real.
Las organizaciones ya están invirtiendo millones de dólares en tecnologías que integran las definiciones de datos con las herramientas de análisis para ayudar a analizar los datos y, así, eliminar las ambigüedades en los equipos y las instituciones. Como consecuencia, los procesos y las herramientas de selección de datos (cómo catálogos de datos y gobernanza semántica) convergen con las plataformas de BI para vincular datos con el contexto de negocios.
Un catálogo de datos cumple la función de un glosario empresarial de fuentes de datos y definiciones de datos comunes. Los expertos en el tema, como los ingenieros de datos y las personas que trabajan con estos, pueden agregar descripciones y definiciones a los campos y las fuentes de datos, además de incluir etiquetas para mejorar el descubrimiento e incluso indicadores útiles de calidad de datos, como notificaciones de certificaciones de contenido fiable o mantenimiento o desuso de conjuntos de datos.
Los usuarios cotidianos no necesitan saber dónde se encuentran los datos en la fuente de datos, pero sí deben comprender qué representan en el mundo real. Por ejemplo, los analistas y los consumidores de contenido a menudo necesitan verificar el origen los datos (también denominado análisis de procedencia). Y, si los conjuntos de datos cambian, los ingenieros de datos y las personas que trabajan con datos deben analizar las consecuencias posteriores de los activos conectados a las tablas o esquemas que administran. La combinación de un catálogo de datos y una plataforma de BI ayuda a optimizar todas esas tareas y proporciona métricas de uso para identificar rápidamente los dashboards y las fuentes de datos a los que se accede con mayor frecuencia.
A pesar de que los catálogos de datos son muy necesarios, se podría decir que hay una oportunidad aún mayor más allá de la gobernanza de metadatos en el área de gobernanza semántica. La semántica ayuda a conectar no solo el contexto de los datos, sino también la intención de las acciones de análisis, por ejemplo, el mapeo de sinónimos para conectar comandos como “tamaño del pedido” con “cantidad”. De esa forma, se habilitan modalidades nuevas para que todos los tipos de personas que trabajan con datos puedan interactuar con datos y obtener información nueva rápidamente. Una forma es por medio de interacciones de lenguaje natural, en las que la plataforma de BI comprende capas que incluyen múltiples consultas, como “resaltar el máximo, el mínimo y el promedio”.
A medida que sigan confluyendo estas tecnologías y procesos, la semántica y la selección de datos proporcionarán una base más sólida para el resto de la experiencia de análisis. Asimismo, se unificarán componentes más diversos del ecosistema de datos, como la limpieza y el análisis posterior, y se alimentarán recomendaciones más eficientes generadas por máquinas para tablas, uniones de columnas y modelos de datos. En última instancia, los avances en la selección de datos le permitirán al personal hacer mucho más que preguntas sobre los datos durante el análisis de datos: podrán indagar sobre su negocio.