Si usted es parte de una organización o equipo que busca paneles e informes elaborados con una cantidad decente de datos agregados que se organizaron y formatearon de manera que cualquier tomador de decisiones pueda leer, entonces seguramente se le han hecho algunas preguntas recurrentes. Éstas incluyen ‘¿De dónde provienen estos datos?’ o ‘¿Puedo confiar en esta métrica o KPI?’ — especialmente si ese informe, métrica o KPI no ha sido realizado por la persona que consume el informe. Algunas organizaciones o equipos que desarrollan herramientas de análisis de datos, como paneles de inteligencia comercial, suelen crear un catálogo de datos. Sí, generalmente; pero no siempre.
¿Qué es un catálogo de datos?
Un catálogo de datos es un inventario de todos los activos de datos. Está diseñado para ayudar a los profesionales a encontrar rápidamente los datos más apropiados para cualquier propósito analítico o comercial. Ese inventario se puede desarrollar desde una simple hoja de cálculo hasta una base de datos relacional compleja y sofisticada. A veces, también se muestra como un esquema de diagrama interactivo. Afortunadamente, hay muchas herramientas disponibles para guardar y mantener catálogos de datos.
Un catálogo de datos utiliza metadatos (datos que describen o resumen otros datos) para crear un inventario informativo y de búsqueda de activos de datos en una organización. Estos activos pueden incluir (pero no se limitan a):
- Datos estructurados (tabulares)
- Datos no estructurados, incluidos documentos, páginas web, correo electrónico, contenido de redes sociales, datos móviles, imágenes, audio y video
- Informes y resultados de consultas
- Visualizaciones de datos y tableros
- Modelos de aprendizaje automático
- Conexiones entre bases de dato
A veces, hay tantos activos de datos que no es posible crear un inventario completo. Entonces, en este caso, hay inventarios más pequeños por equipos, departamentos o secciones dentro de cualquier organización.
Beneficios de un catálogo de datos
Desafortunadamente, puede ser común encontrar que no hay inventarios de datos en absoluto, ya que el analista de datos o el desarrollador de inteligencia empresarial ya sabe muy bien qué datos se han utilizado para desarrollar el informe, el tablero o el análisis.
El problema surge cuando el consumidor de dicho tablero o informe no es la misma persona que el desarrollador. Es entonces comienzan a aparecer las preguntas indicadas al principio.
Crear un catálogo de datos lleva un poco de tiempo, no mucho en comparación con el tiempo invertido en desarrollar una solución analítica, pero brinda un gran beneficio para la organización en general, todos, desde el desarrollador y el analista de negocios hasta los que toman las decisiones y el consumidor de datos
Describamos algunos de los muchos beneficios de tener y mantener un catálogo de datos.
Establece la base del gobierno de datos
El simple ejercicio de revisar los datos, comprender cómo se obtienen y almacenan y determinar el estado general de los datos ayuda a los desarrolladores a trabajar en la configuración de reglas básicas ‘a priori’. Esto ayuda aún más a mantener la calidad de los datos que consume la organización.
Mientras esto sucede, los desarrolladores pueden trabajar con la empresa para mejorar la entrada de datos a los sistemas o incluso hacer sugerencias sobre cómo mejorar la calidad de los datos en las primeras etapas.
Mejora la gestión del equipo
Los catálogos de datos pueden mejorar la gestión de equipos. Por ejemplo, los equipos de datos pueden centrarse en qué tipo de datos son relevantes para el análisis y qué datos usar para desarrollar productos y aplicaciones.
Esto permite a los administradores de equipos de datos elaborar mejores estrategias sobre cómo escalar el almacenamiento y mejorar la gobernanza a escala global. También ayuda a los gerentes a identificar a los mejores desarrolladores de productos de datos con tipos específicos de datos.
Aumenta la confianza de los tomadores de decisiones
Si los tomadores de decisiones y los consumidores de datos saben cuándo se crea un catálogo de datos, entonces no tienen tantas preguntas sobre la confianza en las métricas o los informes.
Hay un beneficio colateral adicional de esto: los gerentes y los tomadores de decisiones pueden estar más comprometidos con la capacitación. Además, pueden aprender más sobre el gobierno de datos y comprender la importancia de la calidad de los datos.