Tech

Milisegundos de tu voz dan más información que una huella dactilar

Un bromista que hizo repetidas llamadas de socorro a la Guardia Costera de Estados Unidos durante el 2014, probablemente pensando que era intocable. No dejaron huellas dactilares ni pruebas de ADN, y se aseguraron de que sus llamadas fueran demasiado breves como para permitirles a los investigadores triangular su ubicación.

Desafortunadamente para este bromista, el análisis de voz con inteligencia artificial ahora está tan avanzado que puede revelar mucho más sobre ti que una mera huella digital. Mediante el uso de una tecnología poderosa para analizar el habla grabada, los científicos de hoy pueden hacer predicciones confiables sobre todo, desde las características físicas del hablante como su altura, peso, estructura facial y edad, hasta su nivel socioeconómico e incluso su estado de salud física y mental, indica un reporte de Simon Brandon para el WEF.

Una de las principales científicas en este campo es Rita Singh, del Instituto de Tecnologías del Lenguaje de la Universidad Carnegie Mellon. Cuando la Guardia Costera estadounidense envió sus grabaciones de las llamadas fraudulentas de 2014, Singh ya había trabajado en reconocimiento de voz durante 20 años.

"Dijeron, 'dinos lo que puedas'", comentó al podcast Women in Tech Show a principios de este año. "Fue entonces cuando comencé a mirar más allá de la señal. ¿Cuánto podría decirle a la Guardia Costera sobre esta persona? ".

1

Rita Singh es una experta en reconocimiento de voz. (Imagen: WEF)

Qué dice tu voz sobre ti

Las técnicas desarrolladas por Singh y sus colegas en Carnegie Mellon analizan y comparan pequeñas diferencias, imperceptibles para el oído humano, en cómo los individuos articulan el habla. A continuación, dividen la voz grabada en pequeños fragmentos de audio, milisegundos de duración, y usan técnicas de inteligencia artificial para analizar estos fragmentos en busca de identificadores únicos.

Tu voz puede regalar mucha información ambiental, también. Por ejemplo, la tecnología puede adivinar el tamaño de la habitación en la que alguien está hablando, si tiene ventanas e incluso de qué están hechas sus paredes. Incluso más impresionante, quizás, la Inteligencia Artificial puede detectar firmas en la grabación por fluctuaciones en la red eléctrica local, y luego puede unirlas a bases de datos específicas para dar una muy buena idea de la ubicación física de la persona que llama y la hora exacta que eligieron el teléfono.

Todo esto se aplica a mucho más que llamadas falsas, por supuesto. Los casos penales federales por acoso y abuso infantil han sido ayudados por esta tecnología relativamente reciente. "Los autores de casos basados en la voz han sido encontrados, han confesado y sus confesiones han corroborado en gran medida nuestros análisis", dice Singh.

1

Un retrato visual en 3D de un sospechoso, basado únicamente en una grabación de voz sería el siguiente paso. (Imagen: Shutterstock)

Retratos en 3D

Y recién están comenzando: Singh y sus colegas investigadores están desarrollando nuevas tecnologías que pueden proporcionar a la policía un retrato visual en 3D de un sospechoso, basado únicamente en una grabación de voz. "El audio puede darnos un boceto facial de un hablante, así como su altura, peso, raza, edad y nivel de intoxicación", afirma.

Pero queda camino por recorrer antes de que la tecnología de perfiles de voz de este tipo sea viable en un tribunal. Singh explica: "En términos de admisibilidad, habrá preguntas. Estamos en el mismo lugar donde estábamos con el ADN en 1987, cuando se produjo la primera condena basada en el ADN en los Estados Unidos".

Todo esto ha resultado ser una mala noticia para el incauto bromista de la Guardia Costera. Realizar llamadas de bromas a servicios de emergencia en Estados Unidos se considera un delito federal, punible con fuertes multas y varios años de cárcel; y generalmente las llamadas en sí mismas son la única evidencia disponible. Singh pudo producir un perfil que ayudó a la Guardia Costera a eliminar pistas falsas e identificar a un sospechoso, a quien esperan llevar pronto a juicio.

Dada la actual tasa exponencial de avance tecnológico, es seguro decir que esta tecnología será mucho más utilizada por las fuerzas del orden público en el futuro.

También lee: