{"id":1090813,"date":"2024-04-15T00:48:44","date_gmt":"2024-04-15T00:48:44","guid":{"rendered":"https:\/\/magazineoffice.com\/la-ultima-version-de-grok-de-xai-puede-procesar-imagenes\/"},"modified":"2024-04-15T00:48:47","modified_gmt":"2024-04-15T00:48:47","slug":"la-ultima-version-de-grok-de-xai-puede-procesar-imagenes","status":"publish","type":"post","link":"https:\/\/magazineoffice.com\/la-ultima-version-de-grok-de-xai-puede-procesar-imagenes\/","title":{"rendered":"La \u00faltima versi\u00f3n de Grok de xAI puede procesar im\u00e1genes"},"content":{"rendered":"
\n<\/p>\n
xAI, el competidor de OpenAI fundado por Elon Musk, ha presentado la primera versi\u00f3n de Grok que puede procesar informaci\u00f3n visual. Grok-1.5V es el modelo de IA multimodal de primera generaci\u00f3n de la compa\u00f1\u00eda, que no solo procesa texto, sino tambi\u00e9n \u00abdocumentos, diagramas, cuadros, capturas de pantalla y fotograf\u00edas\u00bb. En el anuncio de xAI, dio algunas muestras de c\u00f3mo se pueden utilizar sus capacidades en el mundo real. Puedes, por ejemplo, mostrarle una foto de un diagrama de flujo y pedirle a Grok que la traduzca al c\u00f3digo Python, hacer que escriba una historia basada en un dibujo e incluso hacer que explique un meme que no puedes entender. Oye, no todo el mundo puede estar al d\u00eda con todo lo que Internet escupe.<\/p>\n
La nueva versi\u00f3n llega apenas un par de semanas despu\u00e9s de que la compa\u00f1\u00eda presentara Grok-1.5. Ese modelo fue dise\u00f1ado para ser mejor en codificaci\u00f3n y matem\u00e1ticas que su predecesor, as\u00ed como para poder procesar contextos m\u00e1s largos para poder verificar datos de m\u00e1s fuentes para comprender mejor ciertas consultas. xAI dijo que sus primeros probadores y usuarios existentes pronto podr\u00e1n disfrutar de las capacidades de Grok-1.5V, aunque no dio un cronograma exacto para su lanzamiento.<\/p>\n
Adem\u00e1s de presentar Grok-1.5V, la compa\u00f1\u00eda tambi\u00e9n lanz\u00f3 un conjunto de datos de referencia al que llama RealWorldQA. Puede utilizar cualquiera de las 700 im\u00e1genes de RealWorldQA para evaluar modelos de IA: cada elemento viene con preguntas y respuestas que puede verificar f\u00e1cilmente, pero que pueden dejar perplejos a los modelos multimodales como Grok. xAI afirm\u00f3 que su tecnolog\u00eda recibi\u00f3 la puntuaci\u00f3n m\u00e1s alta cuando la empresa la prob\u00f3 con RealWorldQA frente a competidores, como GPT-4V de OpenAI y Google Gemini Pro 1.5.<\/p>\n<\/div>\n