Google acaba de lanzar Gemini, su tan esperada respuesta a ChatGPT


Google dice que hay tres versiones de Gemini: Ultra, la más grande y capaz; Nano, que es significativamente más pequeño y más eficiente; y Pro, de tamaño mediano y capacidades medianas.

A partir de hoy, Bard de Google, un chatbot similar a ChatGPT, funcionará con Gemini Pro, un cambio que, según la compañía, lo hará capaz de realizar un razonamiento y una planificación más avanzados. Hoy, una versión especializada de Gemini Pro se está incorporando a una nueva versión de AlphaCode, una herramienta generativa de “producto de investigación” para codificación de Google DeepMind. La versión más potente de Gemini, Ultra, se incluirá en Bard y estará disponible a través de una API en la nube en 2024.

Sissy Hsiao, vicepresidenta de Google y directora general de Bard, dice que las capacidades multimodales del modelo le han dado a Bard nuevas habilidades y lo han mejorado en tareas como resumir contenido, generar ideas, escribir y planificar. «Estas son las mayores mejoras de calidad de Bard desde su lanzamiento», dice Hsiao.

Nueva vision

Google mostró varias demostraciones que ilustran la capacidad de Gemini para manejar problemas relacionados con información visual. Se vio al modelo de IA responder a un video en el que alguien dibujaba imágenes, creaba rompecabezas simples y pedía ideas para juegos que involucraran un mapa del mundo. Dos investigadores de Google también mostraron cómo Gemini puede ayudar con la investigación científica respondiendo preguntas sobre un trabajo de investigación que incluye gráficos y ecuaciones.

Collins dice que Gemini Pro, el modelo que se lanzará esta semana, superó al modelo anterior que inicialmente impulsó ChatGPT, llamado GPT-3.5, en seis de ocho puntos de referencia comúnmente utilizados para probar la inteligencia del software de inteligencia artificial.

Google dice que Gemini Ultra, el modelo que debutará el próximo año, obtiene una puntuación del 90 por ciento, más alta que cualquier otro modelo, incluido GPT-4, en el punto de referencia Massive Multitask Language Understanding (MMLU), desarrollado por investigadores académicos para probar modelos de lenguaje en preguntas sobre temas. incluyendo matemáticas, historia de Estados Unidos y derecho.

«Gemini es lo último en una amplia gama de puntos de referencia: 30 de 32 de los más utilizados en la comunidad de investigación del aprendizaje automático», dijo Collins. «Y por eso lo vemos estableciendo fronteras en todos los ámbitos».



Source link-46