Jua recauda 16 millones de dólares para construir un modelo de IA fundamental para el mundo natural, empezando por el clima


Los grandes modelos de IA (los grandes tesoros de datos de lenguaje, visión y audio que impulsan los servicios de inteligencia artificial generativa) se perfilan como tan importantes en el desarrollo de la IA como lo han sido los sistemas operativos en el desarrollo de los teléfonos inteligentes: en cierto modo lo son. , pareciéndose a las plataformas del espacio (una idea en la que otros también están pensando). Ahora, una startup suiza llamada Jua está utilizando ese paradigma con la ambición de construir una nueva frontera sobre cómo se podría utilizar la IA en el mundo físico. Ha recaudado 16 millones de dólares para construir lo que es esencialmente un gran modelo “físico” para el mundo natural.

La empresa aún se encuentra en una etapa muy temprana. Su primera aplicación será la modelización y predicción de patrones meteorológicos y climáticos, inicialmente en cómo se relacionan con los actores de la industria energética. Su lanzamiento está previsto para las próximas semanas, dijo la compañía. Otras industrias a las que planea apuntar con su modelo incluyen la agricultura, los seguros, el transporte y el gobierno.

468 Capital y Green Generation Fund colideran esta ronda inicial para la startup con sede en Zurich, con la participación de Promus Ventures, Kadmos Capital, los fundadores de Flix Mobility, Session.vc, Virtus Resources Partners, Notion.vc e InnoSuisse.

Andreas Brenner, director ejecutivo de Jua, quien cofundó la empresa con el director de tecnología Marvin Gabler, dice que la creciente «volatilidad» del cambio climático y la geopolítica ha generado una necesidad entre las organizaciones que trabajan en el mundo físico, ya sea en áreas industriales como la energía o la agricultura. o algo más: tener modelos y pronósticos más precisos. 2023 fue un año de máximo nivel para los desastres climáticos, según los Centros Nacionales de Información Ambiental de EE. UU., lo que resultó en daños por valor de decenas de miles de millones de dólares: es esta situación actual la que está impulsando a las organizaciones a implementar herramientas de planificación, no a mencione mejores herramientas predictivas para los analistas de mercado y otros que utilizan esos datos.

En cierto modo, este no es un problema nuevo, ni siquiera un problema que los tecnólogos no hayan estado abordando ya con la IA.

La división DeepMind de Google ha creado GraphCast; Nvidia tiene FourCastNet; Huawei tiene Pangu, que el año pasado lanzó un componente meteorológico que generó un gran interés. También hay proyectos en marcha para construir modelos de IA a partir de datos meteorológicos para centrarse en otros fenómenos naturales, como se destacó la semana pasada en este informe sobre un equipo que intenta aportar nuevos conocimientos sobre los patrones de migración de las aves.

La respuesta de Jua a esto es doble. En primer lugar, cree que su modelo es mejor que los demás, en parte porque está ingiriendo más información y es más grande (un múltiplo de 20 veces mayor que GraphCast, afirma). En segundo lugar, el clima es sólo el punto de partida para considerar un conjunto más amplio de preguntas, respuestas y desafíos físicos.

“Las empresas deben mejorar sus capacidades para responder a todo esto [climate] volatilidad”, afirmó. “Así que, en el corto plazo, ese es el problema que estamos resolviendo. Pero mirando hacia el futuro, estamos construyendo el primer modelo fundamental para el mundo natural… Básicamente, estamos construyendo un modelo de máquina que aprende física… y ese es uno de los pilares clave para lograr la inteligencia artificial general porque simplemente entender el lenguaje no es suficiente. No es suficiente”.

La compañía aún tiene que lanzar sus primeros productos, pero el acto de fe que están dando los inversores no se debe solo a la exageración de todo lo relacionado con la IA.

Antes de Jua, Gabler dirigió la investigación en Q.met, un actor desde hace mucho tiempo en el pronóstico del tiempo; y también trabajó en tecnología de aprendizaje profundo para el gobierno alemán. Brenner ha trabajado en el sector energético y anteriormente fundó una startup de software de gestión de flotas. En conjunto, esas experiencias unen no solo la conciencia técnica de los problemas y las posibles soluciones, sino también la comprensión de primera mano de cómo la industria experimenta esto.

También está mostrando algunos de sus primeros trabajos a inversores y posibles clientes, obteniendo sus aportaciones sobre los datos a medida que continúa desarrollando el producto.

Uno de los objetivos parece ser adoptar un nuevo enfoque respecto del concepto de lo que implican los modelos predictivos. Al construir un modelo de predicción del tiempo, por ejemplo, Brenner dijo que «el uso de estaciones meteorológicas es bastante obvio». Pero además de eso, está ingiriendo lo que él describe como “datos mucho más ruidosos”, incluidas imágenes satelitales y topografía recientes y otros “datos más novedosos y recientes” para construir sus modelos. «La diferencia clave es que estamos construyendo este sistema de extremo a extremo donde todos los datos que solían usarse en diferentes pasos de la cadena de valor ahora se reúnen en el mismo grupo», explicó. La compañía dijo que tiene alrededor de 5 petabytes (5000 terabytes) de datos de entrenamiento, frente a unos 45 terabytes para GPT3 y (supuestamente) 1 petabyte para GPT4. (Sin embargo, comprenda que los datos lingüísticos pueden necesitar menos datos que un modelo del mundo físico).

Otro objetivo, no pequeño, es que la empresa esté tratando de construir algo más eficiente para reducir los costos operativos para ella y para los clientes. «Nuestro sistema utiliza 10.000 veces menos computación que los sistemas heredados», dijo Brenner.

Es notable que Jua esté surgiendo y consiguiendo financiación en este momento en particular.

Los modelos fundamentales se perfilan como la piedra angular de cómo se desarrollará la próxima generación de aplicaciones de IA, por lo que las empresas que construyen y controlan modelos fundamentales tienen mucho valor y poder potencial.

Los mayores impulsores y agitadores en esta área en este momento son empresas como OpenAI, Google, Microsoft, Anthropic, Amazon y Meta: todas ellas empresas estadounidenses. Eso ha estimulado cierta actividad en otras partes del mundo, como Europa, para buscar y financiar campeones locales como alternativas. En particular, 468 Capital también respalda a Aleph Alpha de Alemania, que, al igual que los actores modelo fundacionales en los EE. UU., también está construyendo grandes modelos lingüísticos, pero aparentemente en colaboración más estrecha con clientes potenciales. (Uno de sus lemas es “Soberanía en la era de la IA”).

“Andreas, Marvin y el equipo están construyendo la primera IA básica del mundo para la física y el mundo natural, que será capaz de proporcionar conocimientos potentes para una amplia gama de industrias que dependen de una verdadera comprensión de la naturaleza, desde compañías de seguros hasta proveedores de productos químicos y energía. , a equipos de planificación de desastres, organizaciones agrícolas, aerolíneas y organizaciones benéficas de ayuda”, dijo Ludwig Ensthaler, socio general de 468 Capital, en un comunicado.

Definitivamente hay una sensación de “buen tipo” acerca de una empresa de inteligencia artificial que se propone entender mejor cómo nos está afectando el cambio climático, ayudar a una mejor planificación de desastres y tal vez incluso, algún día, usarse para ayudar a comprender cómo mitigar los daños al medio ambiente. Y el panorama más amplio para una startup que aspira a construir una IA que pueda comprender el mundo físico es que, potencialmente, se puede aplicar a un conjunto mucho más amplio de desafíos en ciencia de materiales, biomedicina, química y mucho más. Sin embargo, además de la viabilidad del modelo en sí, la perspectiva también conlleva muchas preguntas, similares a las que enfrentan otros tipos de modelos de IA, en torno a la seguridad, la confiabilidad y más, algo en lo que Jua ya está pensando, aunque sea en términos rudimentarios. por ahora.

«Para que los modelos funcionen y sean aceptados, es necesario imponer coherencia», dijo Gabler. «Es necesario asegurarse de que los modelos realmente aprendan física desde cero para resolver los problemas correctamente».



Source link-48