No es ningún secreto que la carrera de la inteligencia artificial avanza a una velocidad meteórica y que en casi cada semana vemos novedades de los principales actores. Ni siquiera hay tregua los fines de semana: ayer sábado
Meta lanzaba
Llama 4, su nueva colección de modelos de inteligencia artificial de código abiertoy no llegan uno sino cuatro: Â Llama 4
Scout,
Llama 4
Maverick y
Llama 4 Behemoth.
Como explica
Meta, todos ellos han sido entrenados con 'grandes cantidades de datos no etiquetados de texto, imagen y vídeo' con un objetivo: que cuenten con una amplia comprensión visual, lo que se traducirá en experiencias de uso mucho más personalizadas. Y si echamos un vistazo a su modelo anterior
Llama 3, comprobaremos además estamos ante configuraciones mucho más potentes.
De
Llama 4
Meta explica que es su primera generación de modelos con arquitectura 'mixture of experts' (MoE), más eficiente computacionalmente tanto para entrenamiento como para resolución de consultas. ¿Cómo funcionan? En pocas palabras, dividen las tareas de procesamiento en subtareas y las asignan a modelos expertos más pequeños y especializados.
Así, entenderemos los primeros como la capacidad de razonamiento o habilidades de resolución del modelo. Por ejemplo,
Maverick tiene 400,000 millones de parámetros totales, pero sólo utiliza 17,000 millones de parámetros activos repartidos entre 128 expertos.