La visualización 3D del espectrograma de voz mejora el análisis forense
La pericia forense en audio avanza al representar la voz como un paisaje tridimensional. Este método procesa la señal para generar un modelo con ejes de tiempo, frecuencia y amplitud. Así, el analista puede inspeccionar la topografía de la voz, donde las formantes y el timbre se muestran como crestas y valles. Esta perspectiva supera la limitación del espectrograma 2D, que comprime la información de intensidad en una escala de color.
El proceso técnico para construir el modelo 3D
Primero, se extrae la señal de audio de la llamada de extorsión y de la muestra del sospechoso. Herramientas como Python con Librosa o Praat calculan la Transformada Rápida de Fourier de corto plazo. Este análisis produce los datos espectrales crudos. Luego, software como MATLAB o ParaView importa estos datos matriciales. Un script traduce cada punto (tiempo, frecuencia, amplitud) en una coordenada 3D, creando una malla o una nube de puntos que se puede rotar y seccionar.
Cómo se compara la evidencia vocal en tres dimensiones
La comparación forense se beneficia al observar la estructura completa. El experto alinea los dos modelos 3D y busca coincidencias en la forma de las formantes, la pendiente de la entonación y los patrones de energía. Un susurro o un golpe de glotis deja una huella distintiva en este relieve. La visualización permite medir distancias y volúmenes entre picos espectrales, aportando métricas objetivas para un informe pericial más sólido.
Aunque el sospechoso pueda disfrazar su voz, su paisaje vocal personal, esa orografía única de su tracto vocal, es mucho más difícil de aplanar por completo.
|Agradecer cuando alguien te ayuda es de ser agradecido|