Gemini de Google es el verdadero comienzo del auge de la IA generativa


La historia de la inteligencia artificial ha estado marcada por períodos del llamado “invierno de la IA”, cuando la tecnología parecía llegar a un callejón sin salida y la financiación se agotaba. Cada uno de ellos ha ido acompañado de proclamas de que hacer que las máquinas sean verdaderamente inteligentes es demasiado difícil de entender para los humanos.

El lanzamiento de Gemini por parte de Google, que se afirma que es un tipo fundamentalmente nuevo de modelo de IA y el más poderoso de la compañía hasta la fecha, sugiere que un nuevo invierno de IA no llegará pronto. De hecho, aunque los 12 meses transcurridos desde el lanzamiento de ChatGPT han sido un año excepcional para la IA, hay buenas razones para pensar que el actual auge de la IA apenas está comenzando.

OpenAI no tenía grandes expectativas cuando lanzó la “vista previa de investigación discreta” llamada ChatGPT en noviembre de 2022. Era simplemente una prueba de una nueva interfaz para sus modelos de lenguaje grande (LLM) generadores de texto. Pero la capacidad del chatbot para hacer una gama tan amplia de cosas, desde sintetizar ensayos y poesía hasta responder problemas de codificación, impresionó y puso nerviosa a muchas personas y encendió la industria tecnológica. Cuando OpenAI agregó su nuevo LLM GPT-4 a ChatGPT, algunos expertos se asustaron tanto que le rogaron a la empresa que redujera el ritmo.

Ya eran escasas las pruebas de que alguien hubiera prestado atención a esa llamada de alarma. Es inconcebible ahora que Google ha subido la apuesta (y quizás también haya cambiado las reglas del juego) al anunciar Gemini.

Google ya se había apresurado a dar una respuesta directa a ChatGPT en forma de Bard a principios de este año, lanzando finalmente la tecnología LLM chatbot que había desarrollado antes que OpenAI pero que había decidido mantener en privado. Con Gemini, afirma haber abierto una nueva era que va más allá de los LLM principalmente anclados en texto, lo que potencialmente prepara el escenario para una nueva ronda de productos de inteligencia artificial significativamente diferentes de los habilitados por ChatGPT.

Google llama a Gemini un modelo “nativamente multimodal”, lo que significa que puede aprender de datos más allá del simple texto, y también puede extraer información de audio, video e imágenes. ChatGPT muestra cómo los modelos de IA pueden aprender una cantidad impresionante sobre el mundo si se les proporciona suficiente texto. Y algunos investigadores de IA han argumentado que simplemente hacer que los modelos de lenguaje sean más grandes aumentaría sus capacidades hasta el punto de rivalizar con las de los humanos.

Pero hay mucho que puedes aprender sobre la realidad física a través del filtro de texto que los humanos han escrito sobre ella y las limitaciones difíciles de erradicar de los LLM como GPT-4, como información alucinante, razonamiento deficiente y su extraña seguridad. fallas—parecen sugerir que ampliar la tecnología existente tiene sus límites.

Antes del anuncio de Gemini de ayer, WIRED habló con Demis Hassabis, el ejecutivo que dirigió el desarrollo de Gemini y cuyos logros anteriores incluyen liderar el equipo que desarrolló el robot sobrehumano AlphaGo para jugar Go. Como era de esperar, se mostró efusivo con respecto a Gemini, afirmando que introduce nuevas capacidades que eventualmente harán que los productos de Google se destaquen. Pero Hassabis también dijo que para ofrecer sistemas de inteligencia artificial que puedan comprender el mundo de una manera que los chatbots actuales no pueden, los LLM deberán combinarse con otras técnicas de inteligencia artificial.

Hassabis compite agresivamente con OpenAI, pero los rivales parecen estar de acuerdo en que se necesitan enfoques nuevos y radicales. Un misterioso proyecto en marcha en OpenAI, llamado Q*, sugiere que la compañía también está explorando ideas que implican hacer algo más que ampliar sistemas como GPT-4.

Esto encaja con los comentarios hechos en abril por el CEO de OpenAI, Sam Altman, en el MIT, cuando dejó claro que a pesar del éxito de ChatGPT, el campo de la IA necesita una gran idea nueva para lograr avances significativos. «Creo que estamos en el final de la era en la que habrá estos modelos gigantes, gigantes», dijo Altman. «Los mejoraremos de otras maneras».

Es posible que Google haya demostrado un enfoque que puede ir más allá de ChatGPT. Pero quizás el mensaje más notable del lanzamiento de Gemini es que Google está decidido a avanzar hacia algo más significativo que los chatbots actuales, tal como parece serlo también OpenAI.



Source link-46