Cloud Wars
  • Home
  • Top 10
  • CW Minute
  • CW Podcast
  • Categories
    • AI and Copilots
    • Innovation & Leadership
    • Cybersecurity
    • Data
  • Member Resources
    • Cloud Wars AI Agent
    • Digital Summits
    • Guidebooks
    • Reports
  • About Us
    • Our Story
    • Tech Analysts
    • Marketing Services
  • Summit NA
  • Dynamics Communities
  • Ask Copilot
Twitter Instagram
  • Summit NA
  • Dynamics Communities
  • AI Copilot Summit NA
  • Ask Cloud Wars
Twitter LinkedIn
Cloud Wars
  • Home
  • Top 10
  • CW Minute
  • CW Podcast
  • Categories
    • AI and CopilotsWelcome to the Acceleration Economy AI Index, a weekly segment where we cover the most important recent news in AI innovation, funding, and solutions in under 10 minutes. Our goal is to get you up to speed – the same speed AI innovation is taking place nowadays – and prepare you for that upcoming customer call, board meeting, or conversation with your colleague.
    • Innovation & Leadership
    • CybersecurityThe practice of defending computers, servers, mobile devices, electronic systems, networks, and data from malicious attacks.
    • Data
  • Member Resources
    • Cloud Wars AI Agent
    • Digital Summits
    • Guidebooks
    • Reports
  • About Us
    • Our Story
    • Tech Analysts
    • Marketing Services
    • Login / Register
Cloud Wars
    • Login / Register
Home » Cómo considerar las seguridad de datos e implicaciones de la IA generativa
Acceleration Economy En Español

Cómo considerar las seguridad de datos e implicaciones de la IA generativa

Pablo MorenoBy Pablo MorenoMarch 3, 2023Updated:March 10, 20238 Mins Read
Facebook Twitter LinkedIn Email
data AI security strategies
Share
Facebook Twitter LinkedIn Email

La inteligencia artificial (IA) ha estado “casi lista para el horario de máxima audiencia” durante al menos 50 años. Finalmente, las predicciones pueden hacerse realidad con la llegada de la IA generativa, que combina enormes cantidades de datos con gran potencia de procesamiento, disponible por primera vez a un precio asequible, y que se utiliza para entrenar los modelos de IA.

A medida que la IA generativa, representada por ChatGPT, se vuelve práctica y asequible, los líderes tecnológicos y empresariales deben comprender cómo la IA afecta los datos y las estrategias de seguridad. Eso comienza con el concepto de entrenamiento del modelo. En este contexto, “capacitar” significa exponer la herramienta de IA, bajo la dirección de “ingenieros del conocimiento”, a grandes cantidades de datos que enseñan a la herramienta a cómo llegar a conclusiones a partir de ese tesoro de datos.

Cuando menciono “grandes cantidades de datos”, es posible que se pregunte, ¿exactamente cuánto es eso? Según OpenAI, la empresa detrás de ChatGPT, éste se entrenó con 570 GB de datos, lo que equivale a 300,000 millones de palabras y 175,000 millones de parámetros. No sé acerca de su marco de referencia, pero eso es una gran cantidad de datos para mí.

Como líder empresarial, debe tener al menos tres preocupaciones con respecto a los datos de entrenamiento en relación con su estrategia de datos:

  1. ¿Los datos de entrenamiento introdujeron algún tipo de sesgo, deliberado o inconsciente, en el modelo?
  2. ¿Los datos eran relevantes para los requisitos específicos de su negocio y la industria en la que compite?
  3. ¿Se incluyó inadvertidamente (o deliberadamente) alguno de sus datos patentados o confidenciales en el conjunto de datos de entrenamiento?

En este análisis, profundizaré en esas preocupaciones y proporcionaré recomendaciones específicas sobre cómo los CXO pueden abordarlas.

Sesgo y vergüenza potencial

El sesgo -un punto de vista sesgado- ha sido un punto de fricción en muchas implementaciones de IA. Nadie quiere sufrir la vergüenza que sufrió Microsoft con “Tay”, una versión anterior de la IA conversacional empresarial. Como estaba bien documentado, los usuarios maliciosos proporcionaron a Tay suficiente información sesgada que rápidamente se convirtió en “inflamatoria”, por decir lo menos, en sus respuestas.

El sesgo puede ser manifiesto, como sucedió con Tay, o inconsciente, causado por lagunas en la información de entrenamiento proporcionada. Por ejemplo, parece que ChatGPT fue entrenado utilizando materiales escritos de Internet. ¿Podría esa estrategia haber introducido sesgo porque no incluía materiales de palabras habladas? Tal vez. Los futuros sistemas de IA se entrenarán con conjuntos de datos mucho más extensos y diversos, lo que debería ayudar a reducir el riesgo de sesgo.

Recomendación para su estrategia de datos : incluso con modelos futuros de IA más grandes, su director de datos y director digital deben validar su IA elegida para garantizar que esté libre de sesgos y la vergüenza o errores que pueden ocasionar.

Relevancia para su negocio o industria

La pregunta clave en el contexto de la “relevancia” de la IA es la siguiente: ¿el modelo de IA se relaciona específicamente con su negocio e industria -a lo que llamaré su dominio- para que brinde valor a su organización?

La mayoría de los modelos comerciales de IA comienzan con un conjunto sustancial de datos de entrenamiento, pero hasta ahora, la mayoría están repletos de conocimiento general. Las organizaciones necesitan un modelo “vacío” que puedan entrenar con sus datos o una IA de conocimiento general que permita agregar datos de entrenamiento específicos de la organización. De esta manera, las preguntas específicas del dominio se pueden responder correctamente.

Guía: El por qué y el cómo de la modernización de datos y negocios

Por ejemplo, las empresas de seguros y los abogados contratan empresas de ingeniería forense para determinar por qué se derrumbó una estructura y si la estructura se construyó de acuerdo con todos los códigos de construcción locales, regionales y nacionales aplicables. Hoy en día, dicho análisis lo realizan ingenieros altamente capacitados y experimentados que visitan el sitio para inspeccionar, tomar fotografías y mediciones, y adquirir muestras para análisis de laboratorio. Los ingenieros también examinan planos y dibujos, e investigan numerosos códigos de construcción y “mejores prácticas” para ese tipo de estructura construida en ese sitio y en ese momento en particular.

Imagine un modelo de IA “entrenado” con todos los códigos de construcción y las mejores prácticas a lo largo del tiempo, además de fotos, videos y mediciones de estructuras colapsadas frente a estructuras intactas. El modelo de IA incluso podría entrenarse para solicitar imágenes, medidas y resultados de pruebas específicos (o recibir el comando de un dron para recopilar sus propios datos en el sitio), luego emitir hallazgos relevantes para resolver reclamos de seguros e incluso demandas. Los conjuntos de datos de entrenamiento para una IA de ingeniería forense de este tipo serían, por supuesto, altamente especializados y extremadamente útiles.

Ahora, reconsideremos la cuestión del “sesgo” en lo que se refiere al entrenamiento de un modelo de IA. Si está entrenando un modelo específico de la organización, es posible que desee incluir un sesgo deliberado para generar respuestas que favorezcan a su organización. Por ejemplo, si su producto es de mayor calidad pero más caro que sus competidores, puede entrenar el modelo de IA para que el costo no sea tan significativo como la calidad. O tal vez quiera ser conocido por ofrecer respuestas imparciales que informen a los clientes potenciales o actuales, incluso si hacen que sus productos se vean inferiores a los demás (piense en las compañías de seguros que comparan tarifas y, a veces, le muestran a un cliente potencial que un competidor es una mejor opción para eso).

Recomendación para su estrategia de datos : considere su cultura y sus datos: el CMO y quizás el director general y la junta, además del director de datos, deben impulsar esta discusión.

El riesgo de seguridad de fuga de datos

Finalmente, consideremos el riesgo de “fuga de datos” cuando se trata de modelos de IA. Obviamente, la protección de datos es un elemento central de la estrategia de datos. La divulgación inadvertida de información patentada o el robo deliberado de dicha información ha sido un problema desde que comenzamos a llevar registros en una tablilla de arcilla.

Lista de los Top 10 de modernización de datos

En lo que respecta a los modelos de IA, hay una pregunta clave que los CXO deben poder responder: ¿Se filtró algún dato organizacional patentado y se incorporó a un modelo público?, o algún creador de modelos de IA, tal vez de un rival comercial, robó datos patentados y ¿Lo incluyó en un modelo público o en un modelo de la competencia?

Los modelos de IA conectados a Internet aumentan significativamente el riesgo de tales eventos. Primero, porque los modelos de IA nunca olvidan nada: todo lo que ingieren está disponible según sea necesario. En segundo lugar, debido a que la IA es excelente para identificar patrones y relaciones de datos ocultos para un ser humano, incluso los hechos aparentemente triviales pueden impulsar decisiones que perjudiquen a su organización. En tercer lugar, el acceso a Internet significa que las personas de todo el mundo pueden tener acceso a información que anteriormente solo existía en una copia impresa en el maletín de un malhechor.

Recomendación para su estrategia de datos: Involucre al CISO, los directores de datos y los “custodios de la información” (asesores generales, jefes de auditoría interna y cumplimiento) en un proyecto para evaluar y reforzar, según sea necesario, la protección de la información (o protección de la propiedad intelectual) y de los múltiples programas.

Conclusión

Los modelos de IA de hoy consumen enormes conjuntos de datos con fines de capacitación, y las herramientas futuras apuntan a consumir “todo el conocimiento humano”. Dada la potencia de las herramientas de IA generativa actuales y los productos mucho más potentes que se están diseñando y visualizando, es vital que su estrategia de datos incorpore un mayor grado de seguridad de datos.

Hasta este punto, podría haber estado bien tener una estrategia de datos supervisada por un director de datos, junto con una estrategia de seguridad supervisada por un CISO. Pero de hoy en adelante, las organizaciones necesitan una estrategia combinada de “datos + seguridad”. Ahora es el momento de comprender la estrategia de datos y las implicaciones de seguridad de las poderosas herramientas de IA generativa y asegurarse de que está protegiendo a su organización del sesgo de datos, la irrelevancia y la fuga de Propiedad Intelectual.

Autor: Wayne Sadin

Artículo original aquí

Share. Facebook Twitter LinkedIn Email
Pablo Moreno
  • Website
  • LinkedIn

Business Data Scientist and Project Manager (Waterfall & Agile) with experience in Business Intelligence, Robotics Process Automation, Artificial Intelligence, Advanced Analytics and Machine Learning in multiple business fields, gained within global business environment over the last 20 years. University Professor of ML and AI, International speaker and Author. Active supporter of Open-Source software development. Looking to grow with the next challenge.

Related Posts

Streamlining Manufacturing Communication: Microsoft Teams & Copilot Lead the Evolution

April 17, 2024
automated vulnerability dection

Cómo la detección automatizada de vulnerabilidades mitiga el fraude y fortalece los sistemas financieros

April 6, 2023

Cómo crear nuevos ahorros en adquisiciones utilizando IA y RPA para agilizar las compras

April 5, 2023
Celonis government

Cómo Celonis brinda beneficios de minería de procesos a instituciones gubernamentales

April 4, 2023
Add A Comment

Comments are closed.

Recent Posts
  • AI Agent & Copilot Podcast: Finastra Chief AI Officer Lays Out Range of Use Cases, Microsoft Collaboration
  • IBM Launches Microsoft Practice to Accelerate AI, Cloud, and Security Transformation
  • AI Agent & Copilot Podcast: JP Morgan Chase CISO Publicly Pushes for Stronger Security Controls
  • ServiceNow Re-Invents CRM for End-to-End Enterprise
  • Inside ServiceNow 2025: How AI, Strategic Partnerships, and Platform Unification Are Reshaping Enterprise IT

  • Ask Cloud Wars AI Agent
  • Tech Guidebooks
  • Industry Reports
  • Newsletters

Join Today

Most Popular Guidebooks

Accelerating GenAI Impact: From POC to Production Success

November 1, 2024

ExFlow from SignUp Software: Streamlining Dynamics 365 Finance & Operations and Business Central with AP Automation

September 10, 2024

Delivering on the Promise of Multicloud | How to Realize Multicloud’s Full Potential While Addressing Challenges

July 19, 2024

Zero Trust Network Access | A CISO Guidebook

February 1, 2024

Advertisement
Cloud Wars
Twitter LinkedIn
  • Home
  • About Us
  • Privacy Policy
  • Get In Touch
  • Marketing Services
  • Do not sell my information
© 2025 Cloud Wars.

Type above and press Enter to search. Press Esc to cancel.

  • Login
Forgot Password?
Lost your password? Please enter your username or email address. You will receive a link to create a new password via email.