Preprocesamiento de señales de audio mediante wavelets para el reconocimiento de patrones a través de redes neuronales

Por: Sepúlveda Villalobos, Gabriel AndrésColaborador(es): Suárez Sotomayor, Alejandro Mario (Comisión de tesis) [, prof. guía] | Hernández Sánchez, Juan Longino (Comisión de tesis) [, prof. corref.] | UTFSM. Departamento de Electrónica (1994-)Tipo de material: TextoTextoDetalles de publicación: Valparaíso : UTFSM , 2006Descripción: 112 h. : ilTema(s): MATLAB (Programas para computador) | ONDULETAS (Matemáticas) | REDES NEURONALES (ciencia de la computación) | BC / MEM (memorias UTFSM con resúmenes)Clasificación CDD: M 006.454 Nota de disertación: Tesis (Ing. Civil en Electrónica mención control e instrumentación)--Prof. guía: Alejandro Suárez Sotomayor; prof. corref. : Juan Hernández S Tema: [Resumen del autor]Tema: El objetivo central del trabajo de título es lograr el diseño e implementación de un sistema reconocedor de patrones de audio, orientado a voz, mediante la utilización de dos herramientas que permitan analizar la señal desde un plano tiempo-frecuencia y realizar un reconocimiento de patrones, adquiridos a través del aprendizaje. Estas herramientas son, respectivamente, la transformada wavelet y redes neuronales. Concretamente, se espera obtener un sistema adaptado a un locutor específico, capaz de discriminar entre un conjunto de cuatro palabras definidas como: abajo, adelante, derecha e izquierda. Esta temática reviste una gran importancia debido a que su desarrollo representa un tipo de interfaz hombre máquina que recientemente se ha ido masificando, alcanzando cada vez mayores niveles de confiabilidad. Las aplicaciones para este tipo de interfaz son variadas, abarcando desde accionamientos activados por voz, hasta operadoras virtuales en telefonía. Anteriormente se han realizado reconocedores de patrones aplicando el análisis wavelet en el pre-procesamiento de señal, para luego reconocer los patrones resaltados por medio de una red neuronal. Sin embargo, dentro de la bibliografía investigada, solo ha sido aplicada como función base dentro de la transformada, el wavelet de Haar. Esta función ha sido ampliamente utilizada para aplicaciones computacionales debido a su simplicidad y a su eficiencia en el consumo de recursos. En el presente documento se ha desarrollado una metodología para extender el análisis citado, al utilizar cuatro wavelets adicionales que permitan concluir si existen beneficios extras para este tipo de aplicación. Las wavelets utilizadas corresponden a la función de Haar, las funciones 3,6 y 9 de la familia Daubechies, y la de Meyer en su versión discreta. Según lo anterior, se comienza por idear un diseño consistente en tres etapas. Este debe considerar la adquisición de datos, su acondicionamiento para resaltar las características esenciales, y luego, un reconocedor que permita discriminar entre las distintas palabras posibles. Cabe destacar que todos los desarrollos han sido realizados sobre el software MatlabTM, utilizando principalmente las toolbox de wavelets y de redes neuronales. Para concluir, se analizan los sistema implementados a través del porcentaje de efectividad en el reconocimiento logrado por cada uno de ellos, concluyéndose que en general todos los métodos alcanzan un buen nivel de aciertos, los cuales se encuentran muy cercanos entre si.
Etiquetas de esta biblioteca: No hay etiquetas de esta biblioteca para este título. Ingresar para agregar etiquetas.
Valoración
    Valoración media: 0.0 (0 votos)
Existencias
Tipo de ítem Biblioteca actual Colección número de clasificación Copia número Estado Fecha de vencimiento Código de barras
Memorias Memorias Biblioteca Central
Memorias M 006.454 S479 (Navegar estantería(Abre debajo)) 1 Disponible 3560900125343

Incluye anexos

CD Rom incluye tesis en formato PDF y presentación en Microsoft Power Point

Tesis (Ing. Civil en Electrónica mención control e instrumentación)--Prof. guía: Alejandro Suárez Sotomayor; prof. corref. : Juan Hernández S

h.92

[Resumen del autor]

El objetivo central del trabajo de título es lograr el diseño e implementación de un sistema reconocedor de patrones de audio, orientado a voz, mediante la utilización de dos herramientas que permitan analizar la señal desde un plano tiempo-frecuencia y realizar un reconocimiento de patrones, adquiridos a través del aprendizaje. Estas herramientas son, respectivamente, la transformada wavelet y redes neuronales. Concretamente, se espera obtener un sistema adaptado a un locutor específico, capaz de discriminar entre un conjunto de cuatro palabras definidas como: abajo, adelante, derecha e izquierda. Esta temática reviste una gran importancia debido a que su desarrollo representa un tipo de interfaz hombre máquina que recientemente se ha ido masificando, alcanzando cada vez mayores niveles de confiabilidad. Las aplicaciones para este tipo de interfaz son variadas, abarcando desde accionamientos activados por voz, hasta operadoras virtuales en telefonía. Anteriormente se han realizado reconocedores de patrones aplicando el análisis wavelet en el pre-procesamiento de señal, para luego reconocer los patrones resaltados por medio de una red neuronal. Sin embargo, dentro de la bibliografía investigada, solo ha sido aplicada como función base dentro de la transformada, el wavelet de Haar. Esta función ha sido ampliamente utilizada para aplicaciones computacionales debido a su simplicidad y a su eficiencia en el consumo de recursos. En el presente documento se ha desarrollado una metodología para extender el análisis citado, al utilizar cuatro wavelets adicionales que permitan concluir si existen beneficios extras para este tipo de aplicación. Las wavelets utilizadas corresponden a la función de Haar, las funciones 3,6 y 9 de la familia Daubechies, y la de Meyer en su versión discreta. Según lo anterior, se comienza por idear un diseño consistente en tres etapas. Este debe considerar la adquisición de datos, su acondicionamiento para resaltar las características esenciales, y luego, un reconocedor que permita discriminar entre las distintas palabras posibles. Cabe destacar que todos los desarrollos han sido realizados sobre el software MatlabTM, utilizando principalmente las toolbox de wavelets y de redes neuronales. Para concluir, se analizan los sistema implementados a través del porcentaje de efectividad en el reconocimiento logrado por cada uno de ellos, concluyéndose que en general todos los métodos alcanzan un buen nivel de aciertos, los cuales se encuentran muy cercanos entre si.

CD revisado, epf 19/02/2007

2