Diseño e implementación de un sistema de reconocimiento de palabras en un FPGA basado en el algoritmo del LPC

Briceño Aranda, César Alberto

Por favor, use este identificador para citar o enlazar este ítem: http://hdl.handle.net/20.500.14076/2228

Registro completo de metadatos

Campo DC	Valor	Lengua/Idioma
dc.contributor.advisor	Mauricio Villanueva, Juan Moisés	-
dc.contributor.author	Briceño Aranda, César Alberto	-
dc.creator	Briceño Aranda, César Alberto	-
dc.date.accessioned	2016-09-27T01:15:34Z	-
dc.date.available	2016-09-27T01:15:34Z	-
dc.date.issued	2012	-
dc.identifier.uri	http://hdl.handle.net/20.500.14076/2228	-
dc.description.abstract	Hace varias décadas el ser humano ha intentado comunicarse con las máquinas de la manera más espontánea, mediante el habla. La dificultad para conseguir que las máquinas entiendan el habla humana es consecuencia de muchos aspectos como variabilidad en los tonos de voz, rapidez de pronunciación, presencia inminente del ruido, acentos regionales, deformación del lenguaje, etc. Los sistemas más sofisticados de reconocimiento de voz se basan en algoritmos de computación implementados en software, que por tanto tienen limitaciones en la rapidez de procesamiento. Es así que se plantearon soluciones novedosas, como aquellas basadas en hardware, por medio de dispositivos lógicos programables como los FPGA (Field Programmable Gate Array), cuyo uso se está extendiendo en muchos aspectos de la vida cotidiana donde se requiere rapidez y gran capacidad de procesamiento, como es el caso de los sistemas de reconocimiento de voz humana. El presente trabajo de tesis muestra el proceso de diseño e implementación de un sistema electrónico capaz de reconocer la voz humana mediante la interpretación del significado de varias palabras pronunciadas por un locutor en particular, en una solución implementada en hardware. El sistema aprovecha las características de rapidez de procesamiento de un dispositivo FPGA y la flexibilidad del lenguaje de descripción de hardware empleado para programar dicho dispositivo, así como la versatilidad del FPGA que nos permite generar circuitos digitales, incluso un procesador embebido, que es programado en C o C++, lo que permitió implementar algoritmos secuenciales de reconocimiento de patrones que están diseñados para su uso en sistemas computarizados. En el presente trabajo se usó un códec de audio para la adquisición de datos de voz, el algoritmo LPC para codificar la voz y una red neuronal tipo perceptrón multicapa para el reconocimiento de los patrones de voz codificados. Palabras clave: Reconocimiento de voz, FPGA, Redes Neuronales Artificiales, Lenguaje C, LPC.	es
dc.description.abstract	For several decades, humans have tried to communicate with machines in the most spontaneous way, through speech. The difficulties in getting machines to understand human speech is the result of many aspects: variability in the tone of voice, speed of pronunciation, imminent presence of noise, regional accents, distortion of language, etc. The most sophisticated speech recognition based on computer algorithms were implemented in software; therefore they are limited in processing speed. Then, new solutions arise, such as those based on hardware, using programmable logic devices such as FPGA (Field Programmable Gate Array), whose use is spreading in many aspects of daily life where you need speed and high capacity of processing, such as systems for human voice recognition. This document shows the process of designing and implementing a digital system capable of recognizing the human voice by interpreting the meaning of several words of one speaker in particular, as a solution implemented in hardware. The system takes advantage of the processing speed feature of the FPGA device, and the flexibility of the hardware description language used to program the device for generating digital circuits including embedded processors, which are programmed in C or C++, language used to achieve the implementation of sequential pattern recognition algorithms that are designed for computer systems. The project used an audio codec for data voice acquisition, LPC algorithm for voice coding, and a multilayer perceptron artificial neural network for voice-coded pattern recognition. Key words: Speech Recognition, FPGA, Artificial Neural Networks, C code, LPC.	en
dc.description.uri	Tesis	es
dc.format	application/pdf	es
dc.language.iso	spa	es
dc.publisher	Universidad Nacional de Ingeniería	es
dc.rights	info:eu-repo/semantics/restrictedAccess	es
dc.rights.uri	http://creativecommons.org/licenses/by-nc-nd/4.0/	es
dc.source	Universidad Nacional de Ingeniería	es
dc.source	Repositorio Institucional - UNI	es
dc.subject	Tecnología de voz	es
dc.subject	Reconocimiento de la voz (Computadoras)	es
dc.subject	Redes neuronales artificiales	es
dc.subject	Automática e instrumentación	es
dc.subject	MATLAB (Programa para computadora)	es
dc.title	Diseño e implementación de un sistema de reconocimiento de palabras en un FPGA basado en el algoritmo del LPC	es
dc.type	info:eu-repo/semantics/masterThesis	es
thesis.degree.name	Maestro en Ciencias con Mención en Automática e Instrumentación	es
thesis.degree.grantor	Universidad Nacional de Ingeniería. Facultad de Ingeniería Eléctrica y Electrónica. Unidad de Posgrado	es
thesis.degree.level	Maestría	es
thesis.degree.discipline	Maestría en Ciencias con Mención en Automática e Instrumentación	es
thesis.degree.program	Maestría	es
Aparece en las colecciones:	Maestría

Ficheros en este ítem:

Fichero	Descripción	Tamaño	Formato
briceno_ac.pdf		5,1 MB	Adobe PDF	Visualizar/Abrir

Mostrar el registro sencillo del ítem

Este ítem está sujeto a una licencia Creative Commons Licencia Creative Commons

Indexado por: