Héctor Álvarez Mella, jefe de departamento e investigador del Observatorio Global del Español
El Observatorio Global del Español defiende entrenar la IA con corpus específicos para reducir su impacto
Héctor Álvarez Mella, jefe de departamento e investigador del Observatorio, advierte del riesgo de que el español se mantenga bajo la hegemonía del inglés, que es hoy en día, «la lengua en la que se está creando realmente la IA»
El Observatorio Global del Español ha defendido la necesidad de entrenar la Inteligencia Artificial (IA) con corpus específicos y no con corpus inmensos, de gran tamaño, para evitar que tenga un gran impacto medioambiental.
De esta forma se ha pronunciado Héctor Álvarez Mella, jefe de departamento e investigador del Observatorio, impulsado por el Instituto Cervantes, en el marco del encuentro '¡Háblame, máquina! Oralidad e IA en español', que se celebra en Logroño y en el Centro Internacional de Investigación de la Lengua Española, ubicado en San Millán de la Cogolla (La Rioja).
Uno de los focos de la mesa redonda que Álvarez Mella ha moderado este martes en San Millán de la Cogolla –cuna del español, donde se escribieron las Glosas Emilianenses en el siglo X–, 'Las variedades del español hablado en la IA', está centrado en la importancia de un entrenamiento del español para la IA que sea sostenible, ha añadido.
Por tanto, es necesario que «no se intente alimentar las máquinas con todos los textos posibles (de variedades del español) porque hay que tener en cuenta que ello tiene un impacto medioambiental enorme», ha indicado el lingüista.
Desde esa perspectiva, en el ámbito de la lingüística, ha precisado, se defiende que el español tiene que tener esa mirada ecológica y, además, es importante entrenar la IA «de manera efectiva con corpus específicos y no con corpus inmensos».
Inauguración de la jornada '¡Háblame máquina! Oralidad e IA en español' en Logroño
Además, ha añadido que se trabaja en esta dirección, como se ha puesto de manifiesto en este encuentro, en el que también se ha explicado el proyecto 'Data Observatory-LATAM-GPT-Corpus', de lenguaje abierto para IA desde Latinoamérica, que articula al sector público y privado.
Álvarez Mella ha destacado que adaptar el habla de la IA, que es un hablante virtualmente potencial con todos los hispanohablantes, a los contextos geográficos, sociales y variedades sociales del español requiere crear o entrenar modelos de manera muy concreta y específica.
Estos entrenamientos permitirán que haya una representación completa del panorama lingüístico del español y que esté presente en todos los ámbitos de uso, como profesional, jurídico y cotidiano, entre otros, ha recalcado.
Si no se empieza a invertir y a crear y a trabajar en Inteligencia Artificial en todas las variedades del español, ha advertido de que se correrá el riesgo de que el español se mantenga bajo la hegemonía del inglés, que es hoy en día, «la lengua en la que se está creando realmente la IA».
Este encuentro, organizado por el Observatorio Global del Español, con la colaboración del Gobierno riojano, reúne a especialistas en lingüística, IA, derecho, ingeniería y empresa de distintos países del ámbito español, para analizar cómo se representan las variedades de español oral y qué aplicaciones reales tiene en la actualidad la Inteligencia Artificial oral en sectores estratégicos.