Empresas de IA que buscan datos producidos por IA para capacitación recursiva


Parece que las empresas de IA, incluidas Microsoft, OpenAI y Cohere, están haciendo todo lo posible para encontrar datos sintéticos con los que entrenar sus productos de IA. Citando la disponibilidad limitada de datos «orgánicos» generados por humanos en la red mundial, estas empresas tienen como objetivo utilizar datos (sintéticos) generados por IA en una especie de ciclo infinito, donde el entrenamiento se logra con datos que ya se han creado de forma generativa.

“Si pudiera obtener todos los datos que necesita de la web, eso sería fantástico”, dijo Aidan Gomez, director ejecutivo de Cohere, la empresa emergente LLM de $ 2 mil millones, al Financial Times. “En realidad, la web es tan ruidosa y desordenada que no es realmente representativa de los datos que desea. La web simplemente no hace todo lo que necesitamos”.



Source link-41