Fundado en 1910
Cerdán

Cerdán

¿Se podrían clonar con IA las voces de Koldo o Cerdán?: un experto explica qué es la «huella digital»

Los tribunales españoles han endurecido los criterios de admisión para estas pruebas y exigen que los audios vengan acompañados de análisis técnicos forenses que garanticen la cadena de custodia

La Guardia Civil ha confirmado en un informe la autenticidad de los ocho audios que incriminan a Santos Cerdán, a la vez que descartan manipulaciones de los mismos. Cada vez que un audio de WhatsApp o cualquier otro tipo de grabación sonora incrimina a alguien en un delito, aparecen las dudas sobre si la IA es capaz de falsificar sonidos con la misma precisión que una auténtica.

La empresa española Lazarus Technology colabora con Europol, FBI y las Fuerzas y Cuerpos de Seguridad del Estado y explica qué señales delatan una edición, qué pruebas admite la pericia forense y cómo distinguir ruido, cortes y deepfakes de una grabación genuina.

Espectómetro

Espectómetro

«La presencia de audios en casos de corrupción en España está llevando a los tribunales a fortalecer los requisitos de autenticidad y análisis forense», según explica Manuel Huerta, CEO de Lazarus Technology.

Actualmente, cerca del 98 % de los juicios en España incluyen pruebas digitales, y son los audios —grabaciones de WhatsApp, notas de voz y llamadas grabadas— el núcleo central de muchos procesos que van desde casos de corrupción hasta disputas laborales y causas penales. El uso masivo de smartphones y mensajería instantánea ha facilitado la grabación y circulación de estos archivos, lo que ha provocado que sean relevantes en los tribunales.

Fraudes y manipulación

El auge de la inteligencia artificial (IA) ha provocado un aumento significativo en la creación de audios falsificados y el uso fraudulento de voces clonadas, una tendencia que va en aumento durante 2023 y 2024. Grupos criminales venden servicios de clonación de voz en foros clandestinos y emplean «tanto técnicas tradicionales como sistemas avanzados de IA capaces de replicar voces con gran realismo», lo que lo hace más difícil a los expertos forenses.

Los tribunales españoles han endurecido los criterios de admisión para estas pruebas y exigen que los audios vengan acompañados de análisis técnicos forenses que garanticen la cadena de custodia, la autenticidad, la integridad y la contextualización del contenido. Laboratorios como el Servicio de Criminalística de la Guardia Civil aplican metodologías especializadas que incluyen el análisis espectral y detección de huellas de edición.

La huella digital

Huerta explica que «la voz es la nueva huella digital en tribunales» y explica que «el reto principal no es la presencia de audios, sino la garantía de su autenticidad ante el perfeccionamiento de técnicas de manipulación y la proliferación de deepfakes».

Metadatos

Metadatos

En el laboratorio de Larazus, los técnicos explican con varios audios de muestra cómo se puede demostrar ante un juez que los sonidos que se aportan como prueba de carga de un delito han sido manipulados o son verdaderos. «Las señales de manipulación suelen ser la acentuación, las pausas, respiraciones o la falta de ruido», comenta el experto. Herramientas como Audacity, Sonic Visualiser, Whisper, Descript o Deepware Scanner analizan esos archivos y desvelan datos clave como «la grabadora o el móvil, la fecha, el formato o la amplitud de onda donde podremos apreciar si el sonido lo ha generado una IA».

Las señales de manipulación suelen ser la acentuación, las pausas, respiraciones o la falta de ruidoManuel HuertaCEO de Lazarus Technology

«Los metadatos son la parte más importante de la huella digital y lo que más debe respetarse en las cadenas de custodia, cuantos más metadatos, más creíble el audio», explica Huerta «el fichero de sonido tiene un hash que es lo que valida que sea único y que su custodia no ha sido alterada».

comentarios
tracking

Compartir

Herramientas