Números como el 17 o 37 están asociados a elecciones humanas habituales
El motivo por el que ChatGPT y otras inteligencias artificiales siempre eligen el número 27
Al entrenar a los modelos con respuestas que gustan a los usuarios, se termina reforzando una respuesta atractiva para las máquinas
Curiosamente, cuando se le solicita a ChatGPT que escoja un número entre 1 y 50, el 27 aparece con sorprendente frecuencia. Lo que podría parecer una simple casualidad ha despertado el interés de investigadores en inteligencia artificial y neurociencia computacional, que buscan comprender cómo estas herramientas simulan la aleatoriedad.
En este sentido, otros chatbots de compañías como Google, Microsoft o Anthropic muestran un patrón similar. La razón, según explican los propios sistemas, es que intentan elegir un número que dé sensación de azar, evitando opciones demasiado evidentes como múltiplos de cinco o diez. Algunos números populares entre los humanos, como 17 o 37, suelen ser descartados para no parecer elecciones predecibles.
Señalan que los modelos de lenguaje de gran tamaño (LLM) no interpretan los números como valores matemáticos, sino como símbolos o cadenas de caracteres. Cada número se representa mediante un vector, lo que restringe la capacidad de generar elecciones realmente aleatorias y explica por qué tienden a repetirse ciertas cifras.
Los números que más se repiten
Daniel Kang, profesor de la Universidad de Illinois Urbana-Champaign, apunta que uno de los motivos por los que los modelos repiten ciertos números podría estar relacionado con el aprendizaje por refuerzo basado en la retroalimentación humana (RLHF). Al entrenar a estos sistemas con respuestas que gustan a los usuarios, se refuerzan determinadas elecciones que resultan atractivas para la máquina, aunque este patrón no es exclusivo de los algoritmos.
De hecho, un estudio con 200.000 participantes humanos reveló que al pedirles escoger un número entre 1 y 100, los más recurrentes fueron 7, 37 y 77. Esto indica que tanto personas como máquinas tienden a percibir algunos números como «más aleatorios» que otros.
Andrej Karpathy, experto en inteligencia artificial, comenta que este fenómeno evidencia cómo los modelos de lenguaje suelen generar respuestas muy similares entre sí.
Finalmente, existen también teorías alternativas, como la de Chester Zelaya, que sugieren que los modelos podrían emplear estrategias tipo teoría de juegos, utilizando, por ejemplo, un árbol binario para dividir el rango de números. Sin embargo, esto es poco probable, ya que los modelos de lenguaje operan sobre probabilidades de secuencias de texto y no aplican razonamientos de ese tipo a menos que se les indique explícitamente.