Diseño y desarrollo de un equipo para reconocer patrones de audio generado por personas con dificultades de comunicación
Tipo de material:![Texto](/opac-tmpl/lib/famfamfam/BK.png)
Tipo de ítem | Biblioteca actual | Colección | número de clasificación | Copia número | Estado | Fecha de vencimiento | Código de barras |
---|---|---|---|---|---|---|---|
![]() |
Biblioteca Central | Memorias | M 006.454 G211 (Navegar estantería(Abre debajo)) | 1 | Disponible | 3560900125337 |
Incluye anexos
Tesis (Ing. Civil Electrónico mención Control Automático e Instrumentación)--Prof. guía: Alejandro Suárez Sotomayor
h.68-69
[Resumen del autor]
Se realiza un reconocimiento de patrones de algunas señales de voz para luego poder implementarlo en un dispositivo para ayudar a personas con dificultad en su comunicación. La señal de voz se pre-procesa mediante Transformada Wavelet. De esta forma se adquieren las características más relevantes de la señal. A su vez existen pasos de reducción de parámetros previos y posteriores a la aplicación de la Transformada Wavelet con motivos de reducir el número de datos por señal. Al obtener los datos más significativos de la señal, se ingresan en una Red Neuronal diseñada para reconocer los patrones de las señales de audio previamente establecidas. Mediante el software Matlab 6.5 se construye todo el procedimiento anteriormente descrito, y de esta forma realizar el entrenamiento de la Red Neuronal para así obtener los pesos y valores de la "bias" (polarización) de la red. La implementación se realiza en un procesador digital de señales, donde se cargan los pesos y bias de la red, junto a una señal de voz. Se implementa la Transformada Wavelet junto a los procesos de reducción de parámetros, para luego ingresar los datos resultantes a la Red Neuronal modelada para ser finalmente clasificada dentro de las salidas previamente establecidas. En este trabajo se utilizaron 3 palabras diferentes, luego de varias configuraciones de la Red Neuronal se obtuvieron resultados finales con una eficiencia en el reconocimiento de un 95% para 2 palabras y un 100% para la restante.
2