Tesis de Maestría

Compresión Perceptual de Audio Digital -- Resumen

En este documento se presenta la implementación de un codificador-decodificador perceptual de sonido que toma como entrada un archivo sin comprimir, muestreado a 44100Hz, cuantizado a 16-bits, estéreo. La señal es procesada en bloques de 512 muestras, y transformada utilizando Transformada Discreta de Coseno Modificada. Estos coeficientes son cuantizados utilizando información de un modelo psicoacústico y posteriormente empaquetados a un archivo utilizando tasa de datos variable. El decodificador toma este archivo y su salida es un archivo con las mismas características que el de origen. Las tasas de datos promedio observadas varían entre 58kbps y 340kbps, estando la más común localizada por arriba de 240kbps. Se muestran resultados de pruebas comparativas de calidad subjetiva entre el formato implementado, MPEG-1 Layer 3 y MPEG-4 Low Complexity Advanced Audio Coding. El codificador-decodificador implementado logra un perfil de alta calidad de acuerdo a los resultados obtenidos.

Intervalo de confianza de un 99%, HSD de Tukey=0.085

Para descargar el documento en formato PDF haz click aquí
El código fuente está disponible aquí
El ejecutable para win32 se encuentra aquí. Es necesario contar con fftw, dll disponible aquí

Los archivos utilizados para las pruebas pueden encontrarse aquí.