¿Qué es la IA generativa? – Revisión Friki


Danny Chadwick, Lensa IA

La IA generativa es una tecnología de inteligencia artificial que podría transformar potencialmente la forma en que interactuamos con las máquinas. Es un tipo de IA que puede crear contenido nuevo como texto, imágenes, audio y video en función de su comprensión del mundo y las entradas del usuario.

En los últimos meses, las aplicaciones que utilizan IA generativa explotaron en el mercado. La aplicación de fotos AI Lensa y el chatbot de OpenAI, ChatGPT, causaron un gran revuelo porque crean texto e imágenes de alta calidad bajo demanda. Ahora Microsoft y Google se están poniendo al día. Pero, ¿qué es la IA generativa y cómo funciona?

¿Qué es la IA generativa?

Para decirlo de la manera más simple posible: la IA generativa es una IA (la llamada «inteligencia artificial») que crea contenido único basado en un aviso de un usuario. Por ejemplo, el aviso que le das a Lensa para que haga de esas geniales fotos de perfil de IA una selección de selfies. En el caso de ChatGPT, un aviso podría ser «escribe un soneto sobre bagels al estilo de HL Mencken». El texto y las imágenes resultantes son totalmente únicos y generados por la IA. Y no se trata solo de texto e imágenes que la IA generativa puede crear. Otros productos de IA pueden crear recreaciones de voz asombrosas, e incluso hay servicios esperando en las alas que pueden crear contenido de video basado en indicaciones de texto.

ChatGPT escribe un soneto sobre bagels.
Danny Chadwick / Revisión Geek

La IA generativa combina dos potentes tecnologías de IA: el aprendizaje automático y la capacidad de crear contenido nuevo. Los programadores de IA utilizan el aprendizaje automático para crear modelos que puedan reconocer patrones y tendencias en los datos existentes, mientras que la generación de contenido permite la creación de elementos únicos como una composición o una imagen. Cuando una IA tiene un tamaño de muestra lo suficientemente grande para extraer (su conjunto de entrenamiento), puede recrear prácticamente cualquier cosa que pueda reconocer. Y debido a que el conjunto de datos para entrenar modelos de IA como ChatGPT es tan grande, puede mezclar y combinar elementos de múltiples fuentes para ofrecer algo que sea único y reconocible como lo que sea que solicite el mensaje.

Tipos de IA generativa y cómo funcionan

Una mano robótica sosteniendo una pila de cajas.
Andrey_Popov / Shutterstock.com

Los algoritmos de IA generativa vienen en muchas formas, pero se dividen en tres categorías generales: redes antagónicas generativas (GAN), codificadores automáticos variacionales (VAEs) y modelos de transformadores como GPT-4. Cada tipo de algoritmo de IA generativa tiene sus ventajas y desventajas.

Las GAN son un tipo de IA generativa que utiliza dos redes neuronales de aprendizaje profundo para generar nuevos datos. La primera red, llamada generador, está entrenada para crear nuevos datos que se asemejan al contenido existente, mientras que la segunda red, llamada discriminador, está entrenada para distinguir entre datos reales y generados. A medida que los programadores entrenan sus IA, el generador aprende a producir imágenes cada vez más realistas que engañan al discriminador haciéndoles creer que son reales. Este proceso se conoce como un «juego minimax» ya que cada red intenta ser más astuta que la otra mientras minimiza sus propios errores.

Una desventaja potencial de las GAN es que a veces pueden producir imágenes poco realistas o borrosas. Por ejemplo, una GAN entrenada para generar imágenes de rostros humanos a veces puede crear imágenes con un par de ojos adicionales o una estructura facial distorsionada. Las manos humanas pueden parecer una auténtica pesadilla. Sin embargo, aún es pronto para esta tecnología, y problemas como este se solucionarán a su debido tiempo.

Los VAE son otro tipo de IA generativa que se utiliza para generar datos nuevos y únicos. A diferencia de las GAN, los VAE utilizan una representación comprimida de sus datos de entrada para generar algo nuevo que se asemeje al original. Los VAE se usan con mayor frecuencia para crear imágenes y videos, pero también pueden generar texto. Una limitación potencial de los VAE es que sus datos pueden no ser tan variados como los generados por las GAN porque los VAE aprenden una representación más restringida de los datos de entrada. Además, los VAE a veces sufren los problemas de imagen distorsionada con los que se encuentran los GAN.

Los modelos de transformadores como GPT-4 son una iteración relativamente nueva de IA generativa que ha atraído muchas miradas debido a su impresionante rendimiento en muchas tareas de procesamiento de lenguaje natural. ChatGPT es el ejemplo estrella de oro actual de un producto de IA basado en transformadores. Estos modelos se basan en un tipo de arquitectura de red neuronal llamada «transformador». Están diseñados para procesar secuencias de datos masivas, están entrenados en un enorme conjunto de datos de texto y pueden dar respuestas coherentes y contextualmente relevantes a un aviso.

La ventaja de los modelos transformadores es que pueden generar texto diverso y de alta calidad. Sin embargo, pueden sufrir sesgos e inexactitudes en los datos de entrenamiento, lo que genera resultados inapropiados o erróneos. Además, la gran cantidad de recursos computacionales y datos requeridos para entrenar y ejecutar estos modelos puede dificultarlos y hacerlos costosos para algunas aplicaciones.

Aplicaciones de la IA Generativa

Una ilustración de dos manos y un cerebro.
issaro prakalung / Shutterstock.com

La IA generativa ya se está utilizando en una gran cantidad de servicios populares. Está el chatbot ChatGPT mencionado anteriormente, creado por OpenAI y su generador de imágenes hermano DALL-E. También hay una gran cantidad de editores de imágenes de IA, incluidos Lensa (iOS, Android), Wonder (iOS, Android) y más. Esos han existido por un tiempo. Pero cuando ChatGPT despegó, Silicon Valley decidió que era hora de dar rienda suelta a la nueva tecnología y anunció un nuevo producto de IA tras otro.

Desde principios de este año, Microsoft y Google anunciaron encantamientos de IA para sus motores de búsqueda. Seguido poco después por los proveedores de búsqueda más pequeños DuckDuck Go y Brave. Microsoft ha agregado la generación de imágenes de IA a Bing y Edge, así como componentes de IA a su suite ofimática. Incluso Opera está agregando ChatGPT a su navegador de escritorio. Además, Shutterstock y Adobe han presentado generadores de arte de IA capacitados en el trabajo de usuarios compensados.

Pero la IA generativa puede ir mucho más allá de los creadores de imágenes, los chatbots y los asistentes de búsqueda. Los profesionales de todos los ámbitos de la vida pueden utilizar estas herramientas en su trabajo. La IA generativa tiene aplicaciones potenciales en el diseño de productos, lo que permite a las empresas crear productos personalizados adaptados a las necesidades de cada cliente. Además, puede ser utilizado por profesionales de la salud para ayudar en el desarrollo de diagnósticos y tratamientos.

Además, la IA generativa puede crear contenido personalizado, como artículos de noticias o listas de reproducción de música. Al analizar las preferencias y el comportamiento de un usuario, los algoritmos generativos de IA pueden generar contenido adaptado a sus intereses, lo que aumenta la participación y la satisfacción del usuario. La IA generativa puede ayudar a crear contenido nuevo para la industria del entretenimiento, como guiones de películas o niveles de videojuegos. La capacidad de generar productos únicos pero similares permite a las empresas crear más contenido de manera más rápida y de mayor calidad.

Esa es solo la punta del iceberg cuando se trata de las posibles aplicaciones de la IA generativa. La tecnología también podría encontrar lugares útiles en muchas otras industrias y profesiones. No sería exagerado comparar esta tecnología, cuando se implementa a gran escala, con la invención de la imprenta o el desarrollo de la línea de montaje en términos de cómo podría transformar la forma en que creamos y consumimos contenido y realizamos nuestro trabajo.

Riesgos potenciales y consideraciones éticas

Una calavera en un flujo digital de unos y ceros.
enzozo/Shutterstock.com

Por supuesto, con cualquier nueva tecnología viene el riesgo de que sea mal utilizada o impactar negativamente a algunos grupos. Una de las principales preocupaciones en torno a la IA generativa es que podría desplazar a escritores, artistas y otros tipos creativos que se ganan la vida haciendo artículos, arte, guiones, libros y más. Otra desventaja potencial de la IA generativa es que podría usarse para hacer falsificaciones profundas de celebridades y políticos que serían indistinguibles de videos e imágenes de personas reales y usarlos para engañar al público. Y, por supuesto, siempre queda pendiente la pregunta de ciencia ficción de qué sucede si permitimos que la IA comience a tomar decisiones sin la supervisión humana adecuada. ¿Se volverá en contra de sus creadores o tomará decisiones que perjudiquen a los humanos, pensando que ayudará?

La buena noticia es que la mayoría de las cuestiones éticas que rodean a la IA son preocupaciones perennes del progreso tecnológico. La destrucción de puestos de trabajo casi siempre acompaña a los avances en la automatización. Pero también viene con herramientas más avanzadas para aquellos que se apegan al oficio. Escritores, artistas y otros creativos ahora tienen un poderoso asistente para ayudarlos con sus vocaciones, no necesariamente para destruirlas. Además, la falsificación de imágenes de celebridades y políticos ha existido desde los primeros programas de edición de fotos. Y nos hemos estado preparando para la toma de control de la IA en las películas desde antes de la primera terminador película. Y si bien son preguntas e inquietudes válidas, es probable que se resuelvan de una manera que beneficie a todos o al menos se aborden de una manera que no implique la pérdida masiva de empleos y la llegada de un gobierno supremo de IA.

Sin embargo, un gran obstáculo que muchos productos de IA tendrán que superar son los derechos de autor. Debido a que la IA generativa se entrena en un conjunto de datos masivo de texto, imágenes, sonidos y más, el material con derechos de autor constituye una parte distintiva de lo que se basa la IA generativa para hacer nuevas creaciones. Por supuesto, la naturaleza de la IA generativa impide una recreación exacta palabra por palabra de un trabajo protegido por derechos de autor, pero todo lo que crea la IA generativa se compone de fragmentos de material protegido por derechos de autor. O al menos la IA aprendió a escribir y dibujar basándose en el trabajo de los humanos. Esto podría dar lugar a posibles demandas por parte de escritores y artistas que sienten que su trabajo fue robado para entrenar a la IA y que merecen una compensación o exigen que la IA «olvide» lo que aprendió de su trabajo.

Pero se podría argumentar que la IA no está copiando de memoria un trabajo protegido y que el aprendizaje automático es equivalente al aprendizaje humano, como si un escritor leyera un libro y se inspirara para escribir el suyo propio de forma similar. Probablemente se reducirá a una batalla judicial en la que un juez tendrá que decidir, «¿cuál es la diferencia entre una IA que aprende imitando y un ser humano que lo hace?» Y eso es solo la punta del iceberg a la hora de desentrañar todas las implicaciones legales que seguramente suscitará la IA generativa. Ahora sería un buen momento para que los abogados repasen sus conocimientos de informática.

Reflexiones finales: Bienvenido al futuro

La IA generativa puede ser tan aterradora como impresionante y fascinante. Pero está aquí ahora, y no va a desaparecer. Dada la tasa de adopción en los primeros meses de 2023, no es una predicción difícil hacer que para fin de año, la IA generativa se incorporará a gran parte de su vida diaria. Y para fines de 2024, puede ser difícil recordar la vida sin esta tecnología.





Source link-39