Práctica de Inworld AI NPC GDC 2024


Las redes neuronales han crecido sustancialmente en los últimos años desde la iteración de los primeros transformadores generativos preentrenados. A medida que NVIDIA ha perfeccionado sus últimas tarjetas gráficas y Tensor Cores, las capacidades de esas redes han mejorado enormemente en los últimos años. Tradicionalmente solo entradas basadas en texto, NVIDIA ha estado aprovechando TensorRT para el aprendizaje profundo y la interpretación de audio. En dos demostraciones prácticas separadas con la tecnología Inworld AI en GDC 2024, tuvimos la oportunidad de intentar convertir tanto los NEO NPC de Ubisoft como el Covert Protocol de NVIDIA.

Pregúntale a cualquier DM que haya defendido una sesión de Dungeons & Dragons en la que haya participado en la última década: aprovechar la oportunidad para traspasar los límites de la campaña (y la moralidad) es donde está la diversión. Ambas demostraciones me ofrecieron rienda suelta para controlar cualquiera de las experiencias casi por completo mediante la voz mientras mi manejador se sentaba a un lado, presumiblemente tomando notas o sacudiendo la cabeza y debatiendo si desconectar o no. Cuando finalmente pude ver el programa NEO NPC de Ubisoft por adelantado, ya estaba trabajando en mi segunda taza de café antes de las 10:00 a. m. y ya estaba lleno de creatividad con clasificación PG-13.

Para la demostración de Inworld de Ubisoft Paris, probé una combinación del motor de caracteres AI de Inworld combinado con animaciones faciales automáticas Audio2Face de NVIDIA. La palabra de moda «autenticidad» apareció varias veces a lo largo de mi sesión y, en su mayor parte, se mantuvo cierta, ya que sus barreras estaban colocadas para tratar de mantener la ilusión de que estaba siendo reclutado para «la resistencia» a través de un urbanita que usa gorro llamado Bloom.

Para gamificar la experiencia de Inworld AI, Ubisoft mantuvo una lista emergente de actividades recomendadas para participar, desde aprender sobre el megacuerpo o Bloom y la resistencia a un nivel holístico. Cada vez que intentaba desviar la conversación, Bloom sacaba a relucir esas barreras invisibles, hacía una pequeña broma reveladora sobre el humor de mi solicitud y luego volvía a intentar que lo interrogara sobre la resistencia. Hay mucha persistencia en mis acciones, o más bien en mis palabras mismas, a lo largo de la manifestación. Cuando me preguntaron sobre mis habilidades únicas, me presenté como un barista entusiasta de las criptomonedas que hubiera preferido ser conocido como Poncho en lugar de Nelson. Bloom estuvo muy contento de hacerlo y compartimos algunas anécdotas antes de que mi objetivo final de obtener una idea del propósito de la demostración llegara a su fin.

La segunda parte de la demostración pasó a ser más bien una sesión de lluvia de ideas de forma libre con Iron, una protagonista femenina de la resistencia que parecía superar en rango a Bloom de manera significativa. Mi misión la segunda vez fue discutir métodos para entrar en una bóveda. Al tomar un controlador y caminar por la sala de reuniones virtual, fui recibido por listas y palabras clave que Ubisoft claramente quería que mencionara e interactuara con Iron para colaborar con una solución para un B&E ligero después del brunch.

Aunque tenía las herramientas ante mí, traté de ensamblarlas de maneras más creativas. Una escalera era una forma obvia de subir y entrar a un edificio del segundo piso, pero ¿por qué no podía llevarme esa escalera y usarla para subir hasta una cámara de seguridad en el pasillo y colgar una foto Polaroid tomada del edificio? pasillo que estaba vigilando para engañar a la cámara y dejarme pasar? Noquear a un guardia que me impedía atravesar el balcón de entrada a la oficina fue un asunto bastante simple para cualquiera que haya jugado un título de Metal Gear Solid, pero ¿cómo se transmite la intención mediante comandos de voz? Iron simplemente haría caso omiso de mis solicitudes de cargar un gancho de agarre en el extremo de una escopeta o caería en el viejo estándar de meterse dentro de una caja de cartón y pasar sigilosamente como una forma de resistencia no violenta. No, en realidad no podía avanzar al siguiente paso sin encontrar una solución para incapacitar al guardia a pesar de mis objeciones vocales. Debido a todos mis rumores y tiempo perdido, me sacaron silenciosamente de la demostración antes de que pudiera encontrar una solución final para irrumpir en la oficina y fugarme con la valiosa información prometida.

La demostración del Protocolo encubierto de NVIDIA fue una experiencia mucho menos guiada y la historia de fondo de esa sesión en particular fue descubrir el número de habitación donde se hospedaba una persona de interés en un hotel de cinco estrellas. ¿Mi historia de portada preferida? Mensajero con algunos bienes ilícitos que requerirían una firma directa para poder liberarlos. El botones que fue el primer NPC de Inworld con el que interactué parecía mucho más agradable con mis sugerencias de lo que resultaron ser Bloom o Iron. Si bien sus conversaciones eran mucho más reaccionarias, parecía abierto a las sugerencias de que me hiciera un masaje en los pies o lo invitara a un karaoke una vez que completara mi misión. Lamentablemente, no pude convencer a la IA para que cantara algunas melodías sobre la marcha, pero sí se aseguró de decirme que su antiguo karaoke era el mega éxito de Psy, ‘Gangnam Style’. En una chispa de creatividad, me propuse provocarle un poco de infierno cuando mencionó mi corte de pelo y le informé que era calvo y que no necesitaba ningún viaje de peinado. Terminando mi conversación, caminé hacia las puertas de entrada del hotel y estaba a punto de poner un pie en la recepción cuando vi un rostro bronceado en el cristal mirándome fijamente, con una blusa bien brillante; Ciertamente no es un mophead en lo más mínimo. Si tuviera tiempo de jugar una segunda vez, tendría curiosidad por ver si el personaje del jugador realmente vendría equipado con deliciosos mechones dependiendo de las respuestas del jugador o si cada demo comenzaría como un caballero calvo y hermoso.

Los otros dos NPC de IA fueron mucho menos maleables en sus respuestas y ninguno parecía querer darle la hora del día a un extraño en la historia. Eso fue hasta que localicé una tarjeta de trabajo convenientemente ubicada a un lado. Una vez que tuve eso en mi inventario, las personalidades de ambas IA parecieron escuchar mis solicitudes previstas y brindarme información valiosa para mi objetivo previsto. Este interruptor que se activó le quitó un poco la inmersión y, aunque entiendo, por razones de juego, que sí, es necesario que haya objetivos con los que el jugador pueda interactuar en lugar de simplemente conversar sobre el clima o los sabores de champú favoritos, tomó lejos de la sensación de juego de rol de verse obligado a cumplir objetivos discretos en lugar de la promesa de un juego de forma libre.

No importa cuán absurda fuera mi solicitud, siempre y cuando mantuviera las preguntas PG-13 y evitara cualquier cosa verdaderamente obscena, los modelos de lenguaje accederían a mis solicitudes y normalmente responderían con respuestas humorísticas y perspicaces. La calidad de la experiencia con estos personajes y modelos de lenguaje es, en última instancia, tan buena como aquello en lo que están entrenados y el poder de procesamiento para descifrar solicitudes inusuales. Ubisoft y NVIDIA han demostrado que tienen diferentes caminos para crear una conversación realista con el jugador, manteniendo al mismo tiempo barreras de seguridad que podrían resultar útiles para integrarse en juegos en el futuro. Queda por ver si estas herramientas realmente se pueden integrar en los juegos antes de que finalice la generación actual de consolas. Aún así, mi escepticismo ha disminuido por ahora y me he encontrado interesado en ver qué les depara el futuro a estos NPC potenciados por IA.

Comparte esta historia

Facebook

Gorjeo



Source link-29