Fundado en 1910
ChatGPT es una herramienta que nos puede facilitar el estudio

Los resultados evidenciaron la dificultad de los participantes para discernir entre ambos sujetosGetty Images

IA

El avance de la inteligencia artificial que la hace parecer más humana que nunca

La clave del rendimiento de las herramientas radicó en el entrenamiento previo impartido por los investigadores

Un reciente estudio de la Universidad de California, publicado en la revista PNAS, ha revelado que los sistemas de inteligencia artificial generativa actuales ya son capaces de superar el histórico test de Turing, diseñado en 1950 para evaluar si una máquina puede replicar el comportamiento comunicativo humano.

La investigación demuestra que, al recibir las directrices idóneas, los modelos pueden adoptar con éxito rasgos sociales como el humor, la franqueza y la falibilidad.

El experimento consistió en enfrentar a cerca de 300 participantes a conversaciones simultáneas con un interlocutor real y una máquina, debiendo identificar la identidad de cada uno tras abordar temas cotidianos y experiencias personales.

Para la prueba se emplearon cuatro herramientas de distintas generaciones: las actuales GPT-4.5 y LLaMa-3.1-405B, y las más antiguas GPT-4o y ELIZA, el chatbot pionero de los años 60.

Más naturales que los humanos

Los resultados evidenciaron la dificultad de los participantes para discernir entre ambos sujetos. El modelo GPT-4.5 logró el mayor índice de éxito al ser identificado como humano en el 73 % de las ocasiones, lo que sugiere que sus respuestas resultaron más naturales que las de personas reales.

Por su parte, LLaMa-3.1-405B alcanzó un 56 % de aprobaciones, mientras que las versiones previas, GPT-4o y ELIZA, se situaron muy por debajo, registrando un 23 % y un 21 % respectivamente.

La clave del rendimiento de las herramientas radicó en el entrenamiento previo impartido por los investigadores, quienes las instruyeron para encarnar la personalidad de jóvenes habituados al lenguaje coloquial de internet.

Resultados en entornos sin preparar

En ausencia de estas pautas, la efectividad disminuyó notablemente, siendo LLaMa la más destacada en entornos sin preparar con un 38 % de aciertos. Los autores concluyen que, si bien la tecnología posee la facultad de emular a las personas, carece de la autonomía para descifrar esos códigos sociales sin una guía externa.

Asimismo, advierten sobre los riesgos de seguridad que plantea esta destreza si es explotada de forma maliciosa para fraudes o manipulación política.

comentarios
tracking

Compartir

Herramientas