OpenAI acaba de presentar su esperado nuevo modelo, bautizado sencillamente como "o1", aunque también era ya conocido de forma coloquial como el "modelo Strawberry". Y desembarca con la promesa de abordar problemas más complejos que sus antecesores, haciendo gala de una capacidad de razonamiento avanzada.
De hecho, este modelo es el primero de una nueva serie de modelos de inteligencia artificial entrenados para simular un proceso de pensamiento similar al humano, lo que constituye un hito significativo en la evolución de los grandes modelos de lenguaje (LLMs, por sus siglas en inglés).
A diferencia de sus predecesores, como GPT-4o, o1 ha sido entrenado utilizando un enfoque innovador basado en el aprendizaje por refuerzo, una técnica en la que el sistema aprende a resolver problemas recibiendo recompensas y penalizaciones por sus acciones.
Según Noam Brown, investigador de
OpenAI, lo que diferencia a o1 de otros modelos es su capacidad de 'pensar' antes de responder. Este proceso de razonamiento, le permite procesar consultas complejas de manera más efectiva, a medida que simula pasos intermedios para llegar a una solución.
Gracia a eso, cuenta con capacidad para resolver problemas más complejos, como tareas de programación y matemáticas avanzadas, con una precisión considerablemente mayor que sus predecesores...
...