La inteligencia artificial (IA) parece estar infundida en todos los aspectos posibles hoy en día: servicios en la nube, chips de computadora, teléfonos, automóviles y mucho más. Sin embargo, la IA está lejos de ser perfecta y de ser inteligente. Como tal, la salida de datos de la IA no siempre es precisa, lo que significa que todavía se necesitan personas para gobernar, monitorear y tomar decisiones basadas en sistemas imperfectos de IA.
Para comprender lo que realmente está sucediendo, primero cubramos los conceptos básicos de la IA.
Sistemas de IA y experimentación con datos
En pocas palabras, la inteligencia artificial es el proceso mediante el cual los sistemas y las máquinas pueden imitar procesos cognitivos propios de humanos. Como todos sabemos, el proceso cognitivo humano se basa en el ensayo y error que involucra la experimentación de eventos, reacción o retroalimentación, observación de resultados y luego de vuelta a la experimentación. Así es como aprendemos a hablar, caminar, montar en bicicleta, etcétera.
Los sistemas de IA siguen un patrón similar, pero la diferencia clave es que los sistemas sólo pueden experimentar con datos, mientras que los humanos pueden experimentar con datos y acciones. Por eso es tan importante tener buenos datos para el desarrollo de sistemas, puedan experimentar y realizar análisis automatizados sobre ellos.
Una vez que se completa el análisis, los sistemas producen un resultado basado en reglas que han sido predefinidas por humanos, que posteriormente analizan dichos resultados. En definitiva, es vital reforzar la intervención humana y la experiencia para comprender POR QUÉ un sistema de IA generó un resultado específico y CÓMO se puede utilizar dicho resultado para impulsar objetivos estratégicos.
Los humanos son cruciales en el proceso, ya que el resultado generado por IA puede desviarse potencialmente de los criterios originales. Dependiendo del caso de uso de la IA, esto puede tener impactos que van desde inexistentes hasta potencialmente catastróficos.
Aprovechar los aspectos positivos de la “deriva de datos”
La causa principal de que los modelos de IA se desvíen se debe a algo llamado “deriva de datos” (data drift, en inglés). Esto ocurre cuando los nuevos datos de entrada que procesa el modelo difieren significativamente de los datos originales con los que se entrenó dicho modelo. Si bien esto puede parecer un resultado adverso, hay muchos elementos positivos que considerar, ya que pueden brindar una excelente retroalimentación estratégica al equipo de operaciones.
Un ejemplo es que la “desviación de datos” puede indicar un cambio en la tendencia general del entorno, y por tanto los datos y las características recopiladas por el modelo para producir los resultados comienzan a ser distintas a las originales. Lo que significa que es necesario volver a evaluar todo el proceso del modelo y el algoritmo utilizado. Además, considere profundizar en los datos sin procesar. Quizás las características que eran relevantes cuando se construyó el modelo de IA ya no lo son.
Por el contrario, si no hay cambios en las tendencias de las características de los datos comparados con los originales, esto puede indicar problemas de calidad, corrupción, obsolescencia o falta de gobernanza de los datos del último conjunto de datos. Nuevamente, esto requiere que las personas adecuadas supervisen todo el proceso.
Consideraciones finales
Por lo general, la responsabilidad general de la gestión de datos recae directamente sobre los hombros del director de datos y sus equipos de analistas. Eso significa que, a pesar del aumento en los volúmenes y las fuentes de datos, son responsables de los datos de entrada y salida de los sistemas de IA. Afortunadamente, hay muchas herramientas disponibles, tanto de código abierto como con licencia comercial, para optimizar la resiliencia de MLOps y gestionar los problemas de “deriva de datos”.
Finalmente, los CXO deben asegurarse de proporcionar los recursos necesarios (soluciones y personas) a los equipos de datos para perfeccionar continuamente la confiabilidad de los datos, que es la base de todas las organizaciones en nuestro mundo digital primero.
En pocas palabras: tanto los datos generados por IA como los generados por humanos necesitan escrutinio. Entonces, ¡manténgase alerta!