Desarrollo e implementación de un sistema de reconocimiento automático del hablante mediante redes perceptrón multipaca, para mejorar la tasa de reconocimiento

Joo Aguayo, Alcides Guillermo

Por favor, use este identificador para citar o enlazar este ítem: http://hdl.handle.net/20.500.14076/13113

Título :	Desarrollo e implementación de un sistema de reconocimiento automático del hablante mediante redes perceptrón multipaca, para mejorar la tasa de reconocimiento
Autor :	Joo Aguayo, Alcides Guillermo
Asesor :	Sotelo Valer, Freedy
Palabras clave :	Sistemas automáticos;Procesamiento de señales;Sistema de reconocimiento
Fecha de publicación :	2013
Editorial :	Universidad Nacional de Ingeniería
Resumen :	Una de las características importantes que identifica a una persona es su voz y nosotros los seres humanos usamos la voz para identificar a las personas, así como el género de cada una de ellas. Este hecho se puede emplear para el diseño de sistemas de reconocimiento automático los que podrían reemplazar a los métodos tradicionales como el uso de tarjetas de identificación, claves de acceso, etc. A pesar de la existencia de sistemas comerciales de reconocimiento basados en la voz, el desarrollo de un sistema alternativo no solo nos permite apreciar la aplicación del procesamiento de señales e inteligencia artificial en el reconocimiento del hablante, sino que nos perite el desarrollo de tecnología nacional aplicada y orientada a la solución de problemas reales. El presente trabajo consiste en el diseño e implementación de un sistema automático de reconocimiento basado en la voz usando una red perceptrón multicapa. Para tal fin, la presente tesis se ha organizado en cinco capítulos, los que están expuestos en el orden siguiente: En el capítulo 1, se mencionan los antecedentes del informe de sustentación de tesis, mencionando los trabajos previos y las referencias de aplicación existentes los cuales de alguna manera inspiraron y guiaron la presente investigación. Se plantean los objetivos a los que se desean llegar en el presente informe de suficiencia. Se explica la justificación y alcances de este trabajo para concluir este capítulo listando los recursos empleados para desarrollar la investigación. En el capítulo 2, se describe el sistema de reconocimiento, que partes tiene y en que consiste este sistema. Así mismo se describe el cómo es que el sistema realiza el reconocimiento de voz. En el capítulo 3, se realiza la identificación del problema, dando detalles de cuáles son los límites dentro de los cuales se desea enmarcar esta investigación. Una vez detallado el problema se expone la hipótesis de trabajo. En el capítulo 4, se exponen los fundamentos teóricos necesarios, de los cuales se estudiará en primer lugar las principales características de la voz humana. Se hará un breve estudio fisiológico de la voz, analizando su proceso de formación y sus principales características. Luego se hará un estudio del pitch y de las frecuencias formantes, ya que son las características que son únicas en cada persona y por tal basándonos en estas medidas podemos distinguir a una persona de otra. Se presentarán un conjunto de algoritmos del área de procesamiento de señales para la etapa de preprocesamiento y para la etapa de extracción de características. De esta manera, será posible representar de manera compacta y única la señal de voz de cada persona, y esta nueva representación será usada más adelante como las entradas del sistema de reconocimiento tanto para la etapa de entrenamiento como para la etapa de prueba y funcionamiento. Luego de estudiar la voz y el tratamiento de señales de voz, se presenta una reseña de la red perceptrón multicapa analizando las propiedades que la hacen adecuadas para la tarea de clasificación y reconocimiento. Se mostrará el algoritmo de optimización usado para la tarea de optimización de la red. Se discutirá la función de error adecuada para la tarea de clasificación y se mostrará el algoritmo de back- propagation como un método computacionalmente eficiente para el cálculo del gradiente de la función de error. Se concluye el capítulo de fundamentos teóricos dando una breve explicación de los sistemas de reconocimiento, según las ciencias computacionales como parte del enfoque que permitirá comprender el panorama de esta investigación. En el capítulo 5, se explica la estructura del sistema de reconocimiento, como se realiza la adquisición de señales de voz, la obtención de la señal pre-procesada, la extracción de características de las señales de voz, la obtención del sistema de reconocimiento y la comprobación de la calidad del sistema de reconocimiento de patrones de voz usando redes perceptrón multicapa. Para la comprobación de la calidad se muestran las pruebas y resultados del sistema de reconocimiento. En este capítulo se muestra los patrones característicos de cada persona, y se hace un análisis de la red neuronal para encontrar los parámetros que resulten en una mayor tasa de reconocimiento. Finalmente, para comprobar se hace un análisis del funcionamiento del sistema en tiempo real con la finalidad de verificar el correcto funcionamiento del sistema. Para concluir el informe, se presentan las Conclusiones y Recomendaciones encontradas en el desarrollo del presente trabajo y se adjuntan los anexos pertinentes para complementar la investigación. Este informe es útil porque nos permitió no solo optar por el título de ingeniero sino también porque al momento de realizarlo se aplicaron varios de los tópicos para el área de ciencias computacionales permitiendo realizar un sistema sencillo pero eficaz para realizar el reconocimiento de voz, este trabajo permitirá a las nuevas generaciones tener un referencia para seguir ampliando las investigaciones sobre este tema tan interesante.
URI :	http://hdl.handle.net/20.500.14076/13113
Derechos:	info:eu-repo/semantics/openAccess
Aparece en las colecciones:	Ingeniería Mecatrónica

Ficheros en este ítem:

Fichero	Descripción	Tamaño	Formato
joo_aa.pdf		5,39 MB	Adobe PDF	Visualizar/Abrir

Mostrar el registro Dublin Core completo del ítem

Este ítem está sujeto a una licencia Creative Commons Licencia Creative Commons

Indexado por: