Edificio Roger de Llúria de la Universitat Pompeu Fabra (UPF), en Barcelona
Las IA generativas contribuyen a «propagar formas no normativas del catalán», según un estudio
Un estudio de la Universitat Pompeu Fabra (UPF) de Barcelona ha advertido que algunas de las herramientas de IA generativa más populares «están contribuyendo a propagar formas no normativas del catalán» y que una de las causas es la influencia del castellano en su modelo de entrenamiento.
Los resultados, publicados en la revista 'Linguamática', «dan un toque de alerta a los responsables de la política lingüística para que evalúen y tengan en cuenta el impacto de estas tecnologías en el futuro del catalán para tomar decisiones informadas», informa la UPF en un comunicado este jueves.
Explica que los modelos lingüísticos de estas herramientas de IA generativas «están sesgados, favoreciendo el uso de las estructuras gramaticales y del léxico de las lenguas con más hablantes» (inglés o español, entre otros), que han constituido la base de su entrenamiento.
Los investigadores han analizado 6 modelos tecnológicos, similares a los que utilizan algunas de las herramientas de IA generativa más conocidas, como ChatGPT o Gemini; y de los 6 modelos, 4 eran multilingües y 2 monolingües especializados en catalán.
Los resultados muestran que los modelos multilingües -los de las herramientas de IA generativas más populares--son los que utilizan más formas no normativas del catalán por influencia del español: la probabilidad de que se desvíen del catalán normativo por este motivo es del 55% frente al 27% de los modelos monolingües.
Si se examina la probabilidad media de realizar un uso no normativo en catalán por otros motivos, los resultados de modelos monolingües y plurilingües son similares y, en ambos casos, se sitúan en torno al 4%.