Unos investigadores de la
Universidad de
California afirman que dos modelos de lenguaje GPT-4,5 y LLaMa-3,1-405B han superado el
Test de Turing, la famosa prueba ideada por
Alan Turing para evaluar la 'humanidad' de la inteligencia artificial. Pero, ¿eso significa que estamos frente a un verdadero salto en la cognición de la IA? ¿O es un mero indicador de un experimento mal diseñado y/o ejecutado?
Hace 75 años,
Alan Turing propuso su
test como un experimento para determinar si las máquinas podían ser consideradas 'inteligentes'. En esta prueba, un interrogador humano interactúa simultáneamente con un humano y una máquina a través de una interfaz de texto, y debe identificar cuál de los dos es el humano. Si la máquina logra engañar al interrogador, se considera que ha pasado la prueba.
Aunque esta idea ha sido objeto de intensos debates y múltiples intentos a lo largo de las décadas, hasta ahora ningún sistema había obtenido superar este desafío en su formato original.
Pero el estudio que nos ocupa, desarrollado por Cameron R. Jones y Benjamin K. Bergen, sometió a varios LLMs (los dos ya mencionados, junto a ELIZA y GPT-4o) a una versión rigurosa del
test original.
Así, se basó en conversaciones simultáneas de cinco minutos entre un interrogador humano, otro humano y un modelo de IA, a través de una interfaz de chat. La sorpresa fue que, en muchos casos, los interrogadores eligieron a la IA como el interlocutor humano.