Los resultados evidenciaron la dificultad de los participantes para discernir entre ambos sujetos
IA
El avance de la inteligencia artificial que la hace parecer más humana que nunca
La clave del rendimiento de las herramientas radicó en el entrenamiento previo impartido por los investigadores
Un reciente estudio de la Universidad de California, publicado en la revista PNAS, ha revelado que los sistemas de inteligencia artificial generativa actuales ya son capaces de superar el histórico test de Turing, diseñado en 1950 para evaluar si una máquina puede replicar el comportamiento comunicativo humano.
La investigación demuestra que, al recibir las directrices idóneas, los modelos pueden adoptar con éxito rasgos sociales como el humor, la franqueza y la falibilidad.
El experimento consistió en enfrentar a cerca de 300 participantes a conversaciones simultáneas con un interlocutor real y una máquina, debiendo identificar la identidad de cada uno tras abordar temas cotidianos y experiencias personales.
Para la prueba se emplearon cuatro herramientas de distintas generaciones: las actuales GPT-4.5 y LLaMa-3.1-405B, y las más antiguas GPT-4o y ELIZA, el chatbot pionero de los años 60.
Más naturales que los humanos
Los resultados evidenciaron la dificultad de los participantes para discernir entre ambos sujetos. El modelo GPT-4.5 logró el mayor índice de éxito al ser identificado como humano en el 73 % de las ocasiones, lo que sugiere que sus respuestas resultaron más naturales que las de personas reales.
Por su parte, LLaMa-3.1-405B alcanzó un 56 % de aprobaciones, mientras que las versiones previas, GPT-4o y ELIZA, se situaron muy por debajo, registrando un 23 % y un 21 % respectivamente.
La clave del rendimiento de las herramientas radicó en el entrenamiento previo impartido por los investigadores, quienes las instruyeron para encarnar la personalidad de jóvenes habituados al lenguaje coloquial de internet.
Resultados en entornos sin preparar
En ausencia de estas pautas, la efectividad disminuyó notablemente, siendo LLaMa la más destacada en entornos sin preparar con un 38 % de aciertos. Los autores concluyen que, si bien la tecnología posee la facultad de emular a las personas, carece de la autonomía para descifrar esos códigos sociales sin una guía externa.
Asimismo, advierten sobre los riesgos de seguridad que plantea esta destreza si es explotada de forma maliciosa para fraudes o manipulación política.