(Institución) (Institución)
 

Repositorio digital de tesis - UNI >
Ingeniería, Arquitectura y Ciencias >
Facultad de Ingeniería Eléctrica y Electrónica >
Unidad de Postgrado >
Maestría >

Por favor, use este identificador para citar o enlazar este ítem: http://cybertesis.uni.edu.pe/handle/uni/2228

Título: Diseño e implementación de un sistema de reconocimiento de palabras en un FPGA basado en el algoritmo del LPC
Autor: Briceño Aranda, César Alberto
Temas: Tecnología de voz
Reconocimiento de la voz (Computadoras)
Redes neuronales artificiales
Automática e instrumentación
MatLab (Programa para computadora)
Fecha de publicación: 2012
Lugar de publicación: Universidad Nacional de Ingeniería. Programa Cybertesis PERÚ
Resumen: Hace varias décadas el ser humano ha intentado comunicarse con las máquinas de la manera más espontánea, mediante el habla. La dificultad para conseguir que las máquinas entiendan el habla humana es consecuencia de muchos aspectos como variabilidad en los tonos de voz, rapidez de pronunciación, presencia inminente del ruido, acentos regionales, deformación del lenguaje, etc. Los sistemas más sofisticados de reconocimiento de voz se basan en algoritmos de computación implementados en software, que por tanto tienen limitaciones en la rapidez de procesamiento. Es así que se plantearon soluciones novedosas, como aquellas basadas en hardware, por medio de dispositivos lógicos programables como los FPGA (Field Programmable Gate Array), cuyo uso se está extendiendo en muchos aspectos de la vida cotidiana donde se requiere rapidez y gran capacidad de procesamiento, como es el caso de los sistemas de reconocimiento de voz humana. El presente trabajo de tesis muestra el proceso de diseño e implementación de un sistema electrónico capaz de reconocer la voz humana mediante la interpretación del significado de varias palabras pronunciadas por un locutor en particular, en una solución implementada en hardware. El sistema aprovecha las características de rapidez de procesamiento de un dispositivo FPGA y la flexibilidad del lenguaje de descripción de hardware empleado para programar dicho dispositivo, así como la versatilidad del FPGA que nos permite generar circuitos digitales, incluso un procesador embebido, que es programado en C o C++, lo que permitió implementar algoritmos secuenciales de reconocimiento de patrones que están diseñados para su uso en sistemas computarizados. En el presente trabajo se usó un códec de audio para la adquisición de datos de voz, el algoritmo LPC para codificar la voz y una red neuronal tipo perceptrón multicapa para el reconocimiento de los patrones de voz codificados. Palabras clave: Reconocimiento de voz, FPGA, Redes Neuronales Artificiales, Lenguaje C, LPC.
For several decades, humans have tried to communicate with machines in the most spontaneous way, through speech. The difficulties in getting machines to understand human speech is the result of many aspects: variability in the tone of voice, speed of pronunciation, imminent presence of noise, regional accents, distortion of language, etc. The most sophisticated speech recognition based on computer algorithms were implemented in software; therefore they are limited in processing speed. Then, new solutions arise, such as those based on hardware, using programmable logic devices such as FPGA (Field Programmable Gate Array), whose use is spreading in many aspects of daily life where you need speed and high capacity of processing, such as systems for human voice recognition. This document shows the process of designing and implementing a digital system capable of recognizing the human voice by interpreting the meaning of several words of one speaker in particular, as a solution implemented in hardware. The system takes advantage of the processing speed feature of the FPGA device, and the flexibility of the hardware description language used to program the device for generating digital circuits including embedded processors, which are programmed in C or C++, language used to achieve the implementation of sequential pattern recognition algorithms that are designed for computer systems. The project used an audio codec for data voice acquisition, LPC algorithm for voice coding, and a multilayer perceptron artificial neural network for voice-coded pattern recognition. Key words: Speech Recognition, FPGA, Artificial Neural Networks, C code, LPC.
Identificador digital (URI): http://cybertesis.uni.edu.pe/handle/uni/2228
Aparece en las colecciones: Maestría

Descripción de archivos

Nombre de archivo Descripción Tamaño Formato
briceno_ac.pdf5,1 MBAdobe PDFAbrir/Descargar
Ver estadísticas

Los ítems de DSpace están protegidos por copyright, con todos los derechos reservados, a menos que se indique lo contrario.

 

CC Todos los contenidos de cybertesis.uni.edu.pe, salvo que se indique lo contrario, están licenciados bajo Creative Commons License
UNI | NDLTD | CONCYTEC DSpace Software Copyright © 2002-2008 MIT and Hewlett-Packard Contacto