Introducción
Una gran cantidad de contenido se ha cubierto hasta ahora en este conjunto de artículos ‘Recomendaciones para implementar un Proyecto de Inteligencia Artificial’. Haciendo una descripción general rápida: desde comenzar a configurar un proyecto que debe tratarse como un activo, hasta formar el equipo adecuado, observar algunos aspectos importantes de la calidad de los datos y finalmente entregar el producto de datos; parece que todo ha sido cubierto. Pero permítanme revelar algo realmente importante: el verdadero proyecto comienza ahora. La solución posterior a la implementación debe mantenerse y operarse.
Esta serie de artículos contiene un total de 5 partes distribuidas de la siguiente manera:
Parte 1: Tratar el producto de IA como un activo
Parte 2: Formar el equipo adecuado
Parte 3: ¿Dónde están los datos?
Parte 4: Entrega del producto (usted está aquí)
Parte 5: Mantenimiento y Operación
Esta parte final representa un tipo diferente de proyecto, uno donde no se requiere ‘desarrollo’ en sí, sino mantenimiento y operación. El mantenimiento del producto de IA posterior a la implementación se denomina hoy en día “MLOps”, que es la combinación de “Aprendizaje automático” -Machine Learning- y “Operaciones”.
Esto es muy crítico, ya que normalmente el resultado del producto de IA es lo que consumirá el cliente final. Por lo tanto, la imagen, la reputación y la confianza del propietario del producto de IA se verán afectadas después de la implementación.
Fundamentos: el POR QUÉ
Volvamos a la primera parte donde se mencionó que un proyecto de Inteligencia Artificial debe tratarse como un activo. Pues bien, como adquisición de inversión -es decir, un producto que debe funcionar y dar resultados a largo plazo-, hay que mantenerla. Al igual que adquirir o invertir en un bien inmueble o en un vehículo, éste debe mantenerse (pintado, reparado, bien operado, etc.), lo mismo ocurre con un producto de inteligencia artificial. Un mantenimiento adecuado durará más el ROI y evitará que el modelo produzca resultados erróneos.
Cuando se desarrolló el producto de IA, se entrenó con datos históricos específicos y se desarrolló bajo un contexto muy concreto -contexto social, económico, financiero, organizacional-. Pero los datos como la vida son cambiantes. Los datos representan la vida y el mundo real. Lo que significa que el contexto general evoluciona, impactando cómo se generan los datos y cómo los datos representan el mundo real. Es por esta razón que los productos de datos deben ser constantemente revisados y debidamente mantenidos.
Además de esto, muy a menudo el equipo o la persona responsable del mantenimiento y la operación del producto de IA -una vez que está en producción- normalmente es diferente a la persona que lo desarrolló. Esto también requiere atención, ya que la fricción de las habilidades y / o conocimientos puede afectar el resultado del producto de IA.
Mencionemos también el aspecto de ciberseguridad de tener un producto de IA en producción. No solo porque es posible filtrar datos confidenciales -muy inusual, pero posible-, sino porque es posible hacer cierta ingeniería inversa y eso puede revelar información relevante sobre qué características o variables son relevantes para su producto o servicio.
Por último, pero no menos importante, la infraestructura tecnológica donde se aloja el producto de IA también evoluciona con el tiempo y está sujeta a mejoras, actualizaciones, tiempos de inactividad, incidentes y otros elementos. Estos aspectos deben ser tenidos en cuenta en el mantenimiento donde el producto de IA esté alojado.
Proceso: el CÓMO
Como se ha indicado en el apartado anterior, aquí van algunas recomendaciones básicas a las que prestar atención:
1. Supervisar las tendencias de los nuevos datos.
Compare constantemente con los datos originales que se utilizaron para entrenar el modelo con los datos actuales. Si la diferencia entre el estado de datos anterior difiere significativamente con el estado de datos actual, puede causar una “desviación de datos” -conocido como ‘data drift’-. Esto resultará en una salida incorrecta del modelo. Crear cuadros de mando de Business Intelligence de control de datos es sencillo y muy eficaz. Configure umbrales de seguridad para monitorear las desviaciones de datos.
2. Monitorear la consistencia en la salida del modelo.
El producto de IA no siempre producirá el resultado correcto, producirá resultados aproximados a lo que se espera. Está bien. Lo que no está bien y es un indicio de que algo no va bien es el hecho de que el modelo empieza a producir salidas constantemente muy desviadas -output variance-. El modelo necesita ser revisado y reevaluado. Es importante alimentar el modelo constantemente con nuevos datos para mantenerlo actualizado y siempre capturando los últimos patrones en los datos. Esto es muy recomendable después de verificar que no se está produciendo una desviación significativa de datos.
3. ¿Quién será el propietario de MLOps?
Este no es un punto trivial. Si el equipo o la persona que mantendrá y operará el modelo posterior a la implementación es diferente al que lo desarrolló, asegúrese de que todo esté debidamente documentado. La documentación es una gran debilidad que tienen muchos ingenieros y científicos de datos. La documentación buena y sólida ayudará al propietario de MLOps a operar sin problemas y reducir futuros riesgos.
4. Ciberseguridad
Asegúrese de que todas las características estén enmascaradas correctamente antes de poner en producción un producto de IA. Esto evitará problemas innecesarios y dolores de cabeza. También hace difícil decirle a su competencia lo que es importante para usted, simplemente haciendo ingeniería inversa en las características del modelo. Inspeccione adecuadamente la infraestructura tecnológica comprometida para implementar su modelo. Afortunadamente, la mayoría de los proveedores de la nube ofrecen excelentes funciones de seguridad, incluida la infraestructura de código abierto.
Hay muchas más cosas que decir sobre cómo mantener y operar correctamente un producto de IA posterior a la implementación, pero aquí se enumeran las más relevantes, desde el punto de vista del liderazgo.