Compresión Perceptual de Audio Digital -- Resumen
En este documento se presenta la implementación de un codificador-decodificador perceptual de sonido que toma como entrada un archivo sin comprimir, muestreado a 44100Hz,
cuantizado a 16-bits, estéreo. La señal es procesada en bloques de 512 muestras,
y transformada utilizando Transformada Discreta de Coseno Modificada. Estos coeficientes son
cuantizados utilizando información de un modelo psicoacústico y posteriormente
empaquetados a un archivo utilizando tasa de datos variable. El decodificador toma este archivo y
su salida es un archivo con las mismas características que el de origen. Las tasas de datos
promedio observadas varían entre 58kbps y 340kbps, estando la más común localizada por arriba
de 240kbps. Se muestran resultados de pruebas comparativas de calidad subjetiva entre el
formato implementado, MPEG-1 Layer 3 y MPEG-4 Low Complexity Advanced Audio
Coding. El codificador-decodificador implementado logra un perfil de alta calidad de acuerdo
a los resultados obtenidos.
Intervalo de confianza de un 99%, HSD de Tukey=0.085
Para descargar el documento en formato PDF haz click
aquí
El código fuente está disponible
aquí
El ejecutable para win32 se encuentra
aquí. Es necesario contar con
fftw, dll disponible
aquí
Los archivos utilizados para las pruebas pueden encontrarse
aquí.