Entrevista

Ana Reyes, experta en IA, advierte sobre Hodio: «La auténtica transparencia sería que los algoritmos fueran públicos»

La investigadora analiza cómo funcionan los sistemas de monitorización de redes sociales en plena polémica por el anuncio de Hodio y advierte del enorme volumen de datos que pueden extraerse de internet

¿Cómo se construye una máquina para medir el odio? La ofensiva de Sánchez para controlar lo que dices en internet

La catedrática en Comercialización e Investigación de Mercados en la Universidad Rey Juan Carlos de Madrid Ana Reyes-Menéndez lleva años analizando cómo se comportan los usuarios en redes sociales y cómo los algoritmos permiten estudiar millones de mensajes para detectar tendencias, opiniones o patrones de comportamiento. Su trabajo combina inteligencia artificial, análisis de datos y comunicación digital para comprender cómo se forma la conversación pública en internet.

Sus reflexiones adquieren especial relevancia esta semana después de que el Gobierno haya anunciado Hodio, una herramienta destinada a monitorizar discursos de odio en redes sociales. Reyes-Menéndez explica cómo funcionan realmente los sistemas de escucha social, qué datos pueden recopilar y qué condiciones deberían cumplirse para garantizar la transparencia.

— ¿Para qué se monitorizan realmente las redes sociales?

—Las redes sociales son un espacio perfecto para escuchar la opinión pública porque permiten extraer grandes cantidades de datos. Los científicos empezamos a trabajar mucho con Twitter (ahora X) porque era una plataforma abierta donde era muy fácil conectarse y extraer lo que se decía sobre un tema concreto. Por ejemplo, en una investigación analicé todo lo que se decía con el hashtag Black Friday para entender mejor el comportamiento de los consumidores y después poder recomendar estrategias a las empresas.

Las redes sociales son un espacio perfecto para escuchar la opinión pública porque permiten extraer grandes cantidades de datos

Tengo una investigación de 2018 donde extraje, junto a dos investigadores más, todo lo que se decía con el hashtag World Environment Day en Twitter y luego minaba esos datos y los conectaba con los Objetivos de Desarrollo Sostenible. Después, elaborábamos una agenda que podía ser útil para que Naciones Unidas tuviesen elaborase las políticas que pudieran ser más interesantes para la sociedad.

Investigación para extraer datos con el #WorldEnvironmentDayAna Reyes-Martínez

— ¿Cómo se hace técnicamente ese análisis de redes sociales?

—El proceso tiene siempre dos fases. Primero hay que utilizar un algoritmo de extracción de datos. Tú decides qué quieres analizar: una persona, una empresa o un tema. Por ejemplo, puedes extraer todo lo que se dice sobre inmigración utilizando determinadas palabras clave. Esa información se vuelca en una base de datos enorme con millones de celdas donde no solo aparece lo que se dice, sino quién lo ha dicho, a qué hora, cuántas veces publica o cómo se describe en su perfil.

— ¿Y cuál es la segunda fase?

—La minería de datos. Utilizamos distintos algoritmos para analizar esa información. Uno identifica las palabras clave que más se repiten. Otro analiza los temas principales de las conversaciones mediante modelos de topic modeling. Y un tercero es el análisis de sentimiento, que clasifica cada comentario como positivo, negativo o neutro. Es una herramienta muy potente que se debe utilizar con cuidado.

Es una herramienta muy potente que se debe utilizar con cuidado

— ¿Los algoritmos entienden realmente el lenguaje de internet?

—Si están bien entrenados, sí. El algoritmo se entrena mediante machine learning. Muchas veces el investigador tiene que revisar manualmente los resultados para enseñarle al sistema cuándo algo es positivo o negativo. A partir de ahí el propio algoritmo va aprendiendo y mejora su capacidad de clasificación.

— ¿Es cierto que X ha virado a la derecha desde que lo ha comprado Elon Musk?

Lo que ha pasado es que el acceso a la información a través de la API se ha dificultado mucho porque ahora tenemos que pagar por cada extracción. Antes no era así. Antes era la principal herramienta de escucha social en general para todos los que nos dedicamos a la extracción de datos de redes sociales para investigación, y ahora ya no es la única porque tiene un coste muy elevado.

Musk decidió comprar X porque se dio cuenta de la cantidad de datos que tenía para poder analizar

Por lo tanto, no es tanto que haya virado hacia la derecha o hacia la izquierda, sino que en su momento Elon Musk decidió comprarlo porque se dio cuenta de la cantidad de datos que tenía para poder analizar.

— Usted utiliza estas técnicas con fines científicos. ¿Ve beneficios en que las utilice un gobierno?

—Yo llevo trabajando con esta metodología desde 2018 y he desarrollado una plataforma de escucha social política. Creo que puede ser una herramienta muy útil para que los responsables públicos entiendan qué preocupa realmente a la población y puedan conectar mejor con ella.

El investigador tiene que revisar manualmente los resultados para enseñarle al sistema cuándo algo es positivo o negativo

— Pero también existen riesgos.

—Claro. Cuando se extraen datos no solo se obtiene el contenido de los mensajes. También se extrae mucha información sobre los perfiles. Y hay ejemplos de usos poco éticos de estas herramientas. El caso de Cambridge Analytica en las elecciones de Donald Trump es un ejemplo de cómo la explotación de datos puede influir en procesos políticos.

— ¿Las redes sociales están cada vez más polarizadas?

—Sí, porque las personas tienden a buscar a quienes piensan como ellas. Cuando vemos constantemente opiniones similares a las nuestras, creemos que todo el mundo piensa así. Eso aumenta la polarización del discurso en redes sociales.

Cuando se extraen datos no solo se obtiene el contenido de los mensajes. También se extrae mucha información sobre los perfiles

— ¿Quién ha sabido aprovechar mejor esa polarización en internet, la izquierda o la derecha?

—No creo que sea una cuestión ideológica. Las redes amplifican lo que ya ocurre fuera de ellas. Los partidos o movimientos que han sabido generar polémica o movilización en el mundo real son los que después consiguen amplificar ese impacto en redes.

— ¿Es posible detectar bots o campañas coordinadas?

—Sí, porque existen patrones que se repiten. En mi plataforma todavía no he incorporado esa funcionalidad, pero es algo que se puede hacer analizando determinados comportamientos en la actividad de las cuentas.

Las redes amplifican lo que ya ocurre fuera de ellas

— En el debate actual se plantea incluso que cada persona tenga una sola cuenta vinculada a su identidad. ¿Sería útil?

—La clave no es tanto si se vincula una cuenta a un DNI, sino cuál es la finalidad. Si el objetivo es proteger a las personas, puede tener sentido establecer ciertos límites. Pero si el objetivo es controlar o señalar, entonces estaríamos perdiendo uno de los valores positivos de las redes, que es su carácter abierto.

— En el caso de una herramienta gubernamental como Hodio, ¿qué garantías deberían existir?

—La verdadera transparencia no consiste solo en publicar un informe con resultados. Si una herramienta así está financiada con dinero público, deberían hacerse públicos los algoritmos utilizados y también las bases de datos con las que se trabaja.

Si una herramienta está financiada con dinero público, deberían hacerse públicos los algoritmos

— ¿Por qué es tan importante esa transparencia?

—Porque cuando se extraen datos de redes sociales se obtiene mucha más información de la que parece. Si queremos que la ciudadanía confíe en estas herramientas, es necesario saber exactamente qué datos se recopilan, cómo se analizan y con qué objetivo.

— ¿Cómo podría el Gobierno crear su base de datos para analizar discursos de odio?

—Podría hacerlo de dos maneras. Una sería extraer todo lo que se dice en internet utilizando palabras clave relacionadas con el odio. Otra sería construir una base de datos a partir de las publicaciones públicas de los usuarios. En ambos casos se obtiene mucha información sobre los perfiles.

Cuando se extraen datos de redes sociales se obtiene mucha más información de la que parece

— ¿En qué redes se realizan normalmente estos análisis?

—Depende del objetivo. En mi caso desarrollo algoritmos personalizados según el interés del usuario. Puede incluir Google, X, Instagram o incluso foros especializados. Cada plataforma genera tipos de datos diferentes.

— ¿El futuro del análisis pasará también por el vídeo?

—Es posible, pero es mucho más complejo. Analizar texto es relativamente sencillo porque ya existen muchos algoritmos desarrollados. Analizar vídeo o imágenes requiere tecnologías más avanzadas, por eso normalmente empezamos por el texto.

Estamos hablando de sistemas capaces de analizar millones de datos y de predecir comportamientos

— ¿Qué le preocupa más de todo este debate?

—Que pensemos que estas herramientas son neutras o que solo tienen efectos positivos. Estamos hablando de sistemas capaces de analizar millones de datos y de predecir comportamientos. Por eso es importante que la sociedad entienda cómo funcionan y exija transparencia antes de que se implanten.

comentarios

Ana Reyes, experta en IA, advierte sobre Hodio: «La auténtica transparencia sería que los algoritmos fueran públicos»

La investigadora analiza cómo funcionan los sistemas de monitorización de redes sociales en plena polémica por el anuncio de Hodio y advierte del enorme volumen de datos que pueden extraerse de internet

¿Cómo se construye una máquina para medir el odio? La ofensiva de Sánchez para controlar lo que dices en internet

LO MÁS LEÍDO

Más de Tecnología

Qué aparatos no debemos conectar a una regleta para evitar incendios en casa, según los Bomberos

El iPhone 18 Pro Max será el móvil más pesado de Apple, pero por una buena razón

Amazon Prime Video Ultra: la nueva opción sin publicidad de la plataforma de streaming

Por qué se calienta el cargador del móvil y cómo solucionarlo

El «bombardeo de suscripciones»: así funciona el ciberataque que inunda tu email con miles de mensajes

Ana Reyes, experta en IA, advierte sobre Hodio: «La auténtica transparencia sería que los algoritmos fueran públicos»

La investigadora analiza cómo funcionan los sistemas de monitorización de redes sociales en plena polémica por el anuncio de Hodio y advierte del enorme volumen de datos que pueden extraerse de internet

​¿Cómo se construye una máquina para medir el odio? La ofensiva de Sánchez para controlar lo que dices en internet

¿Hay ideología detrás de la inteligencia artificial? El ejemplo de Grok y Gemini

LO MÁS LEÍDO

Más de Tecnología

Qué aparatos no debemos conectar a una regleta para evitar incendios en casa, según los Bomberos

El iPhone 18 Pro Max será el móvil más pesado de Apple, pero por una buena razón

Amazon Prime Video Ultra: la nueva opción sin publicidad de la plataforma de streaming

Por qué se calienta el cargador del móvil y cómo solucionarlo

El «bombardeo de suscripciones»: así funciona el ciberataque que inunda tu email con miles de mensajes

¿Cómo se construye una máquina para medir el odio? La ofensiva de Sánchez para controlar lo que dices en internet