Financial Times prueba un chatbot de IA entrenado en décadas de sus propios artículos


El Tiempos financieros tiene un nuevo chatbot generativo de IA llamado Ask FT que puede responder las preguntas de sus suscriptores. Al igual que los robots de IA generalizados (como ChatGPT, Copilot o Gemini), los usuarios pueden esperar una respuesta en lenguaje natural seleccionado para cualquier cosa que quieran saber, pero con respuestas derivadas de décadas de información publicada por el medio en lugar de fuentes que sean más difícil de explicar o están sujetos a acción legal en curso. Así que no espere que le dé una respuesta para el mejor receta para fettucini alfredo.

Cuando preguntamos: «¿Quién ejecuta los productos de inteligencia artificial de Microsoft?» la herramienta arrojó una respuesta actualizada y hizo referencia a noticias que surgieron esta semana sobre contratación de microsoft El cofundador de DeepMind, Mustafa Suleyman, como jefe de su nuevo equipo de IA:

Mustafa Suleyman actualmente dirige la división y los productos de IA orientados al consumidor de Microsoft como jefe de IA de Microsoft, reportando directamente a Satya Nadella. [1,2,3]. Fue contratado desde Inflection AI para ampliar el enfoque de Microsoft en el desarrollo de IA generativa para uso personal del consumidor. [1,2,3,4,6].

Los números entre paréntesis corresponden a PIE artículos de los que extrajo información, que enumera debajo de la respuesta. También proporciona el período de tiempo en que se escribieron estos artículos. En el caso de esta pregunta de Microsoft, dice que obtuvo información desde el 1 de marzo de 2023 hasta el 20 de marzo de 2024.

Sin embargo, encontramos inconsistencias en algunas respuestas. En el momento de nuestra prueba, la herramienta incluía a Nikki Haley en su respuesta a nuestra pregunta sobre quién se postula actualmente para las elecciones presidenciales de EE. UU. de 2024, a pesar de que ya había abandonado la carrera.

Está disponible para unos cientos de suscriptores pagos en el PIE Nivel Profesional, que está dirigido a profesionales de empresas e instituciones. Ask FT actualmente funciona con Claude, el modelo de lenguaje grande (LLM) desarrollado por Anthropic, pero eso podría cambiar. En una entrevista con El borde, PIE Lindsey Jayne, directora de productos, dice que el medio está «abordando esto como ‘independiente del modelo’ y viendo cuál satisface mejor nuestras necesidades».

Puede proporcionar respuestas a preguntas sobre acontecimientos actuales, como cuánto financiamiento recibió Intel del gobierno de EE. UU. en virtud de la Ley CHIPS, así como consultas más amplias, como el efecto de las criptomonedas en el medio ambiente. Luego, la herramienta recoge la PIE‘s archivos y resume la información relevante con citas.

Ask FT también responderá preguntas que requieran una profundización en los archivos del FT. Cuando se le preguntó cómo empezó YouTube, respondió correctamente que fue fundado por Chad Hurley, Steve Chen y Jawed Karim en febrero de 2005.

«Hicimos una gran cantidad de pruebas internas y las usamos para refinar cómo instruimos el modelo y cómo construimos el código», dice Jayne. «En este primer grupo de 500, realizamos un seguimiento de cada pregunta y respuesta, así como de los comentarios de los usuarios».

El año pasado, probamos una herramienta similar implementada por los medios digitales propiedad de la empresa de marketing Foundry, que incluye Macmundo, Mundo PCy Asesor Técnico. Sin embargo, en ese momento no era tan útil como lo es Ask FT; mi colega mia sato descubrió que proporcionaba resultados inexactos a preguntas simples como cuándo se lanzó el último iPod Nano.

«No creo que llegues a ser una institución de 135 años si no estás en constante evolución y afrontas estos momentos», dice Jayne. «Pero hay que ser inteligente y no simplemente subirse al tren de las exageraciones… de lo contrario, la gente simplemente juega con ello por la novedad y luego sigue con sus vidas».

La mayoría de los suscriptores aún no podrán probar el chatbot. Ask FT permanecerá en versión beta por ahora, ya que PIE continúa probándolo y evaluándolo.



Source link-37