Diseño e implementación de un sistema de reconocimiento de palabras en un FPGA basado en el algoritmo del LPC

Briceño Aranda, César Alberto

Please use this identifier to cite or link to this item: http://hdl.handle.net/20.500.14076/2228

Title:	Diseño e implementación de un sistema de reconocimiento de palabras en un FPGA basado en el algoritmo del LPC
Authors:	Briceño Aranda, César Alberto
Advisors:	Mauricio Villanueva, Juan Moisés
Keywords:	Tecnología de voz;Reconocimiento de la voz (Computadoras);Redes neuronales artificiales;Automática e instrumentación;MATLAB (Programa para computadora)
Issue Date:	2012
Publisher:	Universidad Nacional de Ingeniería
Abstract:	Hace varias décadas el ser humano ha intentado comunicarse con las máquinas de la manera más espontánea, mediante el habla. La dificultad para conseguir que las máquinas entiendan el habla humana es consecuencia de muchos aspectos como variabilidad en los tonos de voz, rapidez de pronunciación, presencia inminente del ruido, acentos regionales, deformación del lenguaje, etc. Los sistemas más sofisticados de reconocimiento de voz se basan en algoritmos de computación implementados en software, que por tanto tienen limitaciones en la rapidez de procesamiento. Es así que se plantearon soluciones novedosas, como aquellas basadas en hardware, por medio de dispositivos lógicos programables como los FPGA (Field Programmable Gate Array), cuyo uso se está extendiendo en muchos aspectos de la vida cotidiana donde se requiere rapidez y gran capacidad de procesamiento, como es el caso de los sistemas de reconocimiento de voz humana. El presente trabajo de tesis muestra el proceso de diseño e implementación de un sistema electrónico capaz de reconocer la voz humana mediante la interpretación del significado de varias palabras pronunciadas por un locutor en particular, en una solución implementada en hardware. El sistema aprovecha las características de rapidez de procesamiento de un dispositivo FPGA y la flexibilidad del lenguaje de descripción de hardware empleado para programar dicho dispositivo, así como la versatilidad del FPGA que nos permite generar circuitos digitales, incluso un procesador embebido, que es programado en C o C++, lo que permitió implementar algoritmos secuenciales de reconocimiento de patrones que están diseñados para su uso en sistemas computarizados. En el presente trabajo se usó un códec de audio para la adquisición de datos de voz, el algoritmo LPC para codificar la voz y una red neuronal tipo perceptrón multicapa para el reconocimiento de los patrones de voz codificados. Palabras clave: Reconocimiento de voz, FPGA, Redes Neuronales Artificiales, Lenguaje C, LPC. For several decades, humans have tried to communicate with machines in the most spontaneous way, through speech. The difficulties in getting machines to understand human speech is the result of many aspects: variability in the tone of voice, speed of pronunciation, imminent presence of noise, regional accents, distortion of language, etc. The most sophisticated speech recognition based on computer algorithms were implemented in software; therefore they are limited in processing speed. Then, new solutions arise, such as those based on hardware, using programmable logic devices such as FPGA (Field Programmable Gate Array), whose use is spreading in many aspects of daily life where you need speed and high capacity of processing, such as systems for human voice recognition. This document shows the process of designing and implementing a digital system capable of recognizing the human voice by interpreting the meaning of several words of one speaker in particular, as a solution implemented in hardware. The system takes advantage of the processing speed feature of the FPGA device, and the flexibility of the hardware description language used to program the device for generating digital circuits including embedded processors, which are programmed in C or C++, language used to achieve the implementation of sequential pattern recognition algorithms that are designed for computer systems. The project used an audio codec for data voice acquisition, LPC algorithm for voice coding, and a multilayer perceptron artificial neural network for voice-coded pattern recognition. Key words: Speech Recognition, FPGA, Artificial Neural Networks, C code, LPC.
URI:	http://hdl.handle.net/20.500.14076/2228
Rights:	info:eu-repo/semantics/restrictedAccess
Appears in Collections:	Maestría

Files in This Item:

File	Description	Size	Format
briceno_ac.pdf		5,1 MB	Adobe PDF	View/Open

Show full item record

This item is licensed under a Creative Commons License

Indexado por: