No hay duda de que la transformación digital es una necesidad hoy en día, y como dice ‘Gartner’: ‘La era digital requiere analistas de datos en cada profesión, cada proceso, cada decisión y cada acción’.
Sin embargo, no todas las organizaciones se enfrentan a esta transformación digital desde la misma línea de partida; y por esa razón, es muy importante comprender y evaluar internamente dónde nos encontramos y qué hacer para llegar al siguiente paso.
Además, y quizás más importante, entendamos qué roles y funciones diferentes, dentro de un equipo de ciencia de datos, se requieren en el camino hacia una Transformación Digital exitosa.
La ciencia de datos se centra en predecir algo, prescribir algo o, en algunos casos, explicar algo, distinguiéndolo de la inteligencia empresarial (BI), que se centra en la presentación de informes fácticos retrospectivos (que describen algo que sucedió).
La ciencia de datos también es distinta de las tecnologías de procesamiento y almacenamiento de Big Data como Hadoop y Spark. Las organizaciones exitosas coordinan las tres áreas ( ciencia de datos , inteligencia empresarial y big data ) para lograr el máximo valor . Definir un marco global llamado ‘Modelo de madurez de ciencia de datos’ ayudará a reducir la ambigüedad y mejorar la eficiencia del trabajo.
El modelo de madurez de ciencia de datos (DSMM) evalúa la fiabilidad y la sostenibilidad de un equipo de ciencia de datos para ofrecer valor a su organización, ya que este modelo se basa en el concepto de niveles o etapas que atraviesa la organización a medida que madura en la gestión de datos.
Comprender dónde se encuentra la organización dentro de este modelo de madurez es crucial, por lo que redactará la estrategia para pasar a la siguiente etapa.
El modelo consta de tres niveles de madurez y se divide en siete etapas que se aplican a cualquier organización.
No existe una solución llave en mano para desbloquear el poder de la ciencia de datos. A medida que los equipos de ciencia de datos maduran, pueden generar un valor creciente en toda su organización, reforzando aún más la ciencia de datos como una capacidad esencial de cualquier empresa.
¿Qué sucedió?
Informes ad-hoc
· Comenzar a definir las preguntas clave que el análisis puede ayudar a responder para aportar valor al negocio
· Empiece a definir las preguntas clave que el análisis puede ayudar a responder para aportar valor al negocio.
· Discutir las mejores prácticas para la limpieza de datos, los algoritmos preferidos y la validación entre el equipo.
· Revise e investigue los datos históricos existentes para comprender el contexto e identificar impulsores, brechas y correlaciones.
· Hable con las partes interesadas sobre lo que se incluye en los proyectos de investigación (por ejemplo, datos y otros recursos), qué podrían significar los resultados y cómo pueden utilizar los resultados para mejorar el negocio.
· Muestre valor rápidamente: la ciencia de datos puede ser costosa y la gente quiere saber que la inversión vale la pena.
Estrategia para seguir adelante
· Documente su proceso en una ubicación compartida, como una wiki, para que los miembros del equipo puedan consultarlo fácilmente.
· Piense en los tipos de metadatos que son útiles para capturar, como documentación y comentarios sobre cómo se tomaron las decisiones.
· Comparta los resultados con toda la organización para que puedan ver los tipos de problemas que el equipo es capaz de resolver y comenzar a investigar sobre nuevas aplicaciones.
· Realice un seguimiento de cómo se incorporan los resultados de la ciencia de datos a la empresa. ¿La ciencia de datos está haciendo más trabajo de tipo BI? Asegúrese de que la información que proporciona se utilice de forma eficaz y de que pueda demostrar el valor que aporta su trabajo.
¿Porqué sucedió?
Definido y controlado
· Cada paso del proceso analítico se documenta en la intranet como un conjunto de mejores prácticas que cada nuevo miembro del equipo debe aprender.
· Elimina el riesgo de que las personas no sigan el proceso estándar
· La ciencia de datos es inherentemente exploratoria, con muchas variaciones de características y modelos que se descartan antes de decidirse por un resultado final. ¿Cómo puede preservar y exponer este proceso iterativo, de modo que sea altamente transparente para los miembros del equipo y los consumidores?
· ¿Existen fuentes de datos sin explotar que podrían utilizarse para ofrecer mejores conocimientos?
Estrategia para seguir adelante:
· Observe las causas de la variación. Cuando hay sorpresas en los resultados, ¿podrían haberse evitado?
· Educar a los usuarios comerciales sobre el nuevo entorno y las nuevas prácticas
¿Que puede pasar? y optimizar acciones
Optimizar y automatizar
· El equipo de ciencia de datos tiene un proceso para identificar y evaluar posibles innovaciones rápidamente mientras se minimiza el costo de explorar callejones sin salida.
· Educar y mejorar el proceso más allá de la organización de ciencia de datos.
Estrategia para seguir adelante:
· Asociación : los científicos de datos están trabajando para ayudar a mejorar todo el ciclo de vida analítico, desde el descubrimiento de datos hasta la acción empresarial.
Pablo Moreno
Acceleration Economy Analyst