Sin hacer mucho ruido,
Nvidia ha lanzado una versión personalizada y optimizada de
Llama 3,1, bautizada como 'Neotron', un modelo de 70,000 millones de parámetros que ha sacudido el ámbito de la IA... al haber superado en varios 'benchmarks' a los modelos de lenguaje GPT-4 y
Claude 3,5
Sonic. Y dejando claro, de paso, el potencial de los modelos 'open source'.
Una de las pruebas más destacadas en las que Neoton ha sobresalido fue el Arena Hard Benchmark, donde
Neotron alcanzó una puntuación de 85, superando a GPT-4 (79,3) y
Claude 3,5
Sonic (79,2).
Este modelo ha sido desarrollado utilizando como base el modelo de lenguaje de Meta, pero
Nvidia ha añadido un post-entrenamiento (el proceso conocido como 'fine-tuning') que se ha traducido en mejoras sustanciales en lo que respecta a la alineación del modelo con las preferencias humanas.
Este enfoque permite que el modelo proporcione respuestas más útiles y precisas, asignándoles puntuaciones de recompensa basadas en su desempeño. En palabras del experto en IA español Carlos Santana,
"[Mis] conclusiones son que Nemotron mejora sobre
Llama, le induce a generar más razonamiento y resuelve algún prompt que GPT-4o o Sonnet falla".
"Imagino que el 'endgame' aquí de
NVIDIA es favorecer la llegada de modelos open source [...] porque al final, necesitarás de sus GPUs para ejecutarlos. Recordemos,
NVIDIA siempre gana".