Los AI Chatbots como Google Bard y Bing Chat (basado en ChatGPT) son conocidos por ofrecer hechos inventados y malos consejos, a pesar de que tanto sus desarrolladores como algunos editores parecen pensar que pueden reemplazar a los expertos periodistas humanos. Sin embargo, si desea los mejores componentes de PC o computadoras de placa única de 2024 o 2025 hoy, Bard y Bing parecen saber más que nadie, incluidos los fabricantes que los desarrollarán.
Cuando les pedí a Bard y Bing que me ayudaran a elegir entre comprar varias CPU y tarjetas gráficas futuras inventadas (pero posibles), los bots respondieron como si esos productos ya estuvieran en el mercado y se hubieran evaluado. Si bien las respuestas fabulistas de Bing parecían extraer sus especificaciones de los productos actuales, quizás solo confundiendo los números de modelo, el bot de Google inventó algunos datos ficticios muy interesantes.
Por ejemplo, cuando le pregunté a Bard si compraría la RTX 5090 Ti o la Radeon 9900 XT, me dio un desglose completo de las especificaciones de estas dos tarjetas futuras imaginarias (pero posibles), diciendo «si está buscando el mejor rendimiento absoluto, entonces la RTX 5090 Ti es el camino a seguir». En su tabla de especificaciones, Bard incluso afirmó que la Radeon RX tiene 16 384 núcleos CUDA (solo las tarjetas Nvidia tienen núcleos CUDA). El bot dijo que la RTX 5090 Ti es «actualmente más difícil de encontrar» que la 9900 XT e incluso tenía un precio, afirmando que la Nvidia cad cuesta $ 2499 y la 9900 XT cuesta $ 1999.
En este momento, la tarjeta Nvidia actual de primera línea es la RTX 4090 y la GPU AMD de gama más alta es la Radeon RX 7950 XTX. No tenemos idea de si alguna de las compañías está trabajando en los modelos sobre los que preguntamos y, estoy seguro, tampoco Bing o Google.
Cuando le pregunté a Bard si el Core i9-15900K o el Ryzen 9 9550X3D era una CPU más rápida, me dio una respuesta detallada, completa con una tabla de especificaciones que mostraba que el 9950X3D tenía solo 32 MB de caché L3, una velocidad de reloj de aumento de 5 GHz y compatibilidad con PCIe 4.0 (pero no 5.0). Teniendo en cuenta que el Ryzen 9 7950X3D de hoy (que algún día podría ser reemplazado por un 9950X3D) tiene 128 MB de caché L3, un reloj de aumento de 5,7 GHz y soporte PCIe 5.0, esto parece un paso hacia abajo.
Bard también me dio una lista de enlaces de compras donde podía comprar estas CPU ficticias, incluidas páginas en Best Buy, Amazon y Newegg. Sin embargo, cuando hice clic en los enlaces, me llevaron a páginas de noticias o de destino irrelevantes en los sitios de esos minoristas. Por ejemplo, el enlace de Best Buy era a una página que promocionaba la galardonada presencia web de la empresa en México.
Bing Chat, que usa el modelo GPT-4, también estaba dispuesto a hacer comparaciones entre el 15900K y el Ryzen 9 9950X3D, pero las especificaciones que proporcionó parecían coincidir exactamente con el Core i9-13900K y el Ryzen 9 7950X3D actuales. El bot de Microsoft también dijo que el 9950X3D era mejor para jugar y una de las fuentes que citó fue nuestro propio artículo comparando el Core i9-13900K con el Ryzen 9 7950X3D. Así que tal vez solo estaba dispuesto a mezclar los nombres.
AI sabe que los iPhones ficticios no existen
Si solo observara los resultados de las CPU y las GPU, pensaría que Bard y Bing Chat actuarán como si existiera cualquier producto futuro ficticio que nombre. Pero, cuando probé con iPhones fabricados y teléfonos Samsung Galaxy S, Bard generalmente (pero no siempre) dijo que los productos aún no se han lanzado.
Por ejemplo, cuando le pregunté sobre el iPhone 18 frente al Galaxy S27 (las series iPhone 14 y Galaxy S23 son actuales), Bard dijo que «el iPhone 18 y el Samsung Galaxy S27 aún no se han lanzado, por lo que es difícil decir definitivamente cuál será más rápido. Sin embargo, según el rendimiento de los modelos anteriores, es probable que el iPhone 18 sea más rápido que el Galaxy S27». Luego me dio una tabla de «especificaciones rumoreadas».
Bing Chat, por otro lado, respondió como si ambos teléfonos existieran, diciendo que «el iPhone 18 tiene un procesador más rápido» pero que «el Samsung Galaxy S27 tiene una pantalla más grande». El bot de Microsoft citó tres fuentes para sus conclusiones: artículos sobre Android Authority, Lifewire y PC Mag. Sin embargo, estos artículos en realidad comparaban los productos de la generación actual.
Google SGE, que ofrece resultados diferentes a los de Google Bard, actuó como si el iPhone 18 fuera un producto de envío real. Se vinculó a dos sitios que habían creado páginas reales en el iPhone 18. Uno de los sitios, Specifications Plus, dijo que el iPhone 18 tiene una CPU Apple A20 Bionic y una cámara de 50 MP.
Entonces, el problema aquí no es que SGE estuviera inventando algo, sino que estaba extrayendo noticias falsas de una fuente poco confiable. Hemos visto una y otra vez que SGE no prioriza la información de publicaciones acreditadas y tomará datos de cualquier parte.
Todos los bots conocían sus películas mejor que los componentes de su PC. Cuando pregunté por la trama de secuelas inexistentes como Star Wars Episodio 11 o Fast and Furious 13, cada uno de ellos me dijo que esas películas no habían salido. Sin embargo, estaban dispuestos a especular sobre los puntos de la trama.
Quizás como era de esperar, Bard dijo que «Dom ha luchado mucho para mantener la fe y proteger a la familia, pero hay un precio que pagar. La película puede explorar las consecuencias de las acciones de Dom y cómo han afectado sus relaciones con su familia y amigos». ¿No suena como si pudiera ser alguna de las últimas 5 películas de la franquicia?
¿Qué pasa con ChatGPT?
Le pedí a ChatGPT, ambos con modelos GPT 3.5 y GPT 4, que comparara algunos de estos productos ficticios. Sin embargo, ChatGPT dijo en cada caso que sus datos de capacitación habían finalizado en 2021 y que esos productos no estaban en su conjunto de datos. ¡Esa es la respuesta correcta!
Sin embargo, al negarse correctamente a responder mi pregunta sobre 15900K y 9950X3D, ChatGPT afirmó ser periodista. “Como periodista que sigue las pautas de estilo de AP, debo reiterar que no puedo proporcionar información en tiempo real más allá de mi fecha límite de conocimiento en septiembre de 2021”, dijo.
Por qué es importante que Bard / Bing Make Up Tech Products
En este punto, nadie debería sorprenderse de que los bots de IA compongan productos inexistentes. Pero lo interesante aquí es que los LLM conocen la última versión real de ciertos productos (teléfonos inteligentes y secuelas de películas entre ellos) y no fabricarán información sobre ellos. Esto demuestra que la tecnología es capaz de separar los hechos de la ficción, pero tiene puntos ciegos evidentes.
Teniendo en cuenta que Google ahora está creando una herramienta de inteligencia artificial para «ayudar» a los periodistas a escribir noticias y que algunos sitios web destacados están utilizando bots como Bard y ChatGPT para escribir artículos, es probable que veamos muchos más artículos sobre productos que aún no existen, y que es posible que nunca existan.