El nuevo modelo ligero de IA de Microsoft es tan capaz como GPT-3.5 a pesar de ser lo suficientemente pequeño como para ejecutarse en un teléfono inteligente


Lo que necesitas saber

  • Microsoft tiene un nuevo modelo ligero de IA llamado Phi-3 Mini.
  • Phi-3 Mini es uno de los tres modelos más pequeños que lanzará Microsoft, los otros dos son Phi-3 Small y Phi-3 Medium.
  • Microsoft entrenó a Phi-3 Mini utilizando un plan de estudios similar al que aprenden los niños escuchando historias.
  • Debido al hecho de que no hay suficientes cuentos infantiles para entrenar un modelo de IA, Microsoft tiene un LLM que crea libros infantiles para enseñar Phi-3 Mini.
  • Microsoft afirma que Phi-3 Mini es tan capaz como GPT-3.5 pero que tiene un factor de forma más pequeño.

Microsoft ha llegado a un nuevo modelo ligero de IA que promete ofrecer un nivel similar de capacidades al GPT-3.5 en algunas áreas a pesar de ser mucho más pequeño. Phi-3 Mini está entrenado con una cantidad de datos mucho menor que GPT-4 u otros modelos de lenguaje grandes (LLM), pero puede superar a modelos más grandes como Llama 2. El modelo, al ser más pequeño, también le permite funcionar en teléfonos y computadoras portátiles. en lugar de requerir la web.

Microsoft compartió detalles sobre Phi-3 en un trabajo de investigación. El borde Luego compartió información sobre el modelo y citas de Microsoft.





Source link-40