Publicado 07/04/2025 04:22

Meta presenta su nueva generación de modelos de IA Llama 4, con las versiones Scout, Maverick y Behemoth

Los nuevos modelos de IA Llama 4 de Meta.
Los nuevos modelos de IA Llama 4 de Meta. - META

   MADRID, 7 Abr. (Portaltic/EP) -

   Meta ha presentado la próxima generación de sus modelos de Inteligencia Artificial (IA) Llama 4, con las versiones Llama 4 Scout, Maverick y Behemoth, este último uno de los modelos de lenguaje grande (LLM) "más inteligentes del mundo", con 288 mil millones de parámetros y con capacidades que superan a los modelos más avanzados del sector.

   La tecnológica dirigida por Mark Zuckerberg ha dado a conocer su nueva suite de modelos, a la que define como "la más avanzada" compatible con todo el ecosistema Llama, y con la que pretende continuar ofreciendo opciones abiertas para que cualquier usuario pueda "construir el futuro de las experiencias personalizadas".

   Así, con la colección Llama 4, Meta pretende impulsar sistemas más inteligentes que sean capaces de realizar acciones generalizadas, así como comunicarse de forma natural con los humanos y resolver problemas desafiantes que no hayan tratado anteriormente.

   En este sentido, Meta ha presentado Llama 4 con el lanzamiento de Llama 4 Scout y Llama 4 Maverick, los primeros modelos multimodales nativos "de peso abierto", que ofrecen una compatibilidad "sin precedentes" con la longitud del contexto y que son los primeros en basarse en una arquitectura de mezcla de expertos (MoE).

   Por un lado, tal y como ha explicado la compañía en un comunicado en su blog, el modelo Llama 4 Scout dispone de 17 mil millones de parámetros activos con 16 expertos y es capaz de integrarse en una sola GPU Nvidia H100. Asimismo, con una ventana de contexto de 10 millones de tokens, es capaz de superar a modelos de otras compañías del sector como Gemma 3 y Gemini 2.0 Flash-Lite de Google y Mistral 3.1.

   Por su parte, Llama 4 Maverick también es un modelo de 17 mil millones de parámetros activos, sin embargo, se basa en 128 expertos y es capaz de integrarse en un solo host Nvidia H100 DGX. En este caso, se trata de un modelo de mayor tamaño, y Meta ha indicado que ofrece resultados comparables con DeepSeek-V3 en codificación y razonamiento utilizando menos parámetros activos, y que supera a modelos comparables como GPT-4o y Gemini 2.0 en codificación, razonamiento, multilingüe, contexto largo y 'benchmarks' de imagen.

   En el caso de Scout, Meta ha señalado que se trata de un modelo ideado para abordar tareas como el resumen de múltiples documentos, análisis de la actividad extensa del usuario para tareas personalizadas y razonamiento sobre amplias bases de código. Igualmente, Maverick sobresale en la comprensión tanto de imágenes como de texto, lo que permite la creación de aplicaciones de IA sofisticadas que "superan las barreras lingüísticas", así como la escritura creativa.

   Al estar basados en una arquitectura MoE, estos modelos alcanzan más eficiencia computacionalmente para el entrenamiento y la inferencia, lo que, con un presupuesto fijo de FLOPs de entrenamiento, hace que ofrezcan mayor calidad en comparación con un modelo denso, según ha matizado Meta. Esta eficiencia se basa en conservar recursos a través de los expertos enrutados, ya que permite que el modelo solo utilice las partes necesarias para ejecutar una tarea específica.

   Con todo ello, Llama 4 Scout y Llama 4 Maverick ya están disponibles para su descarga a través de llama.com y Hugging Face, de cara a permitir que los usuarios comiencen a crear "nuevas experiencias" con su tecnología más reciente. Igualmente, también están disponibles para todos los usuarios a través de WhatsApp, Messenger, Instagram Direct y el sitio web de Meta AI.

LLAMA 4 BEHEMOTH

   Además de todo ello, Meta también ha presentado su modelo LLM Llama 4 Behemoth, al que califica como "uno de los LLM más inteligentes del mundo", al tratarse de su modelo más potente hasta la fecha.

   Concretamente, cuenta con 288 mil millones de parámetros activos con 16 expertos y, con ello, la tecnológica ha asegurado que este modelo supera a otros modelos del sector como GPT-4.5 de OpenAI, Claude Sonnet 3.7 de Anthropic y Gemini 2.0 Pro de Google, en marcas centradas en STEM como MATH-500 y GPQA Diamond.

   Así, Meta ha explicado que, aunque Behemoth aún está en desarrollo y fase de entrenamiento, se utilizará como guía para sus nuevos modelos dadas sus altas capacidades de inteligencia.

   Con todo ello, Meta ha señalado que compartirá más información sobre sus nuevos modelos Llama 4 en el marco de su conferencia para desarrolladores, LlamaCon, que se celebrará el 29 de abril.

Contador