Por favor, use este identificador para citar o enlazar este ítem: http://hdl.handle.net/20.500.14076/22333
Título : Método de reorganización de datos abiertos aplicando Data Wrangling para incrementar su reusabilidad
Autor : Espinoza Pejerrey, Bertha Marcel
Asesor : Sotelo Villena, Juan Carlos
Palabras clave : Ciencia de Datos;Datos abiertos;Métodos de reorganización;Datasets;Data Wrangling
Fecha de publicación : 2021
Editorial : Universidad Nacional de Ingeniería
Resumen : La investigación que se propone estudia el problema sobre cómo hacer para que los datos abiertos del Perú tengan mayor reusabilidad, así como generar su explotación para los diferentes campos donde se necesite generar información a partir de éstos. El problema descrito ocurre primordialmente en entidades estatales, debido a la falta de recursos y conocimiento, perdiendo la oportunidad de generar información consistente y transparente a partir del reúso de datos ya generados. Entre las dificultades que las entidades estatales poseen, tenemos el acceso a información completa y fidedigna, lo cual impide tener servicios más efectivos y menos costosos. Así mismo retrasa la prevención de eventos desfavorables, a fin de menguar pérdidas tanto físicas como financieras. Para la solución del problema descrito, en la presente tesis se ha implementado un método de reorganización de datos abiertos, de modo que ayude a la explotación y reúso de los datos; esto con el fin de obtener datos listos para generar información a ser utilizada por las entidades y personas que así lo requieran. El método implementado está basado en la aplicación de los conceptos y técnicas de Ciencia de Datos. En la presente investigación se ha elegido la técnica de Data Wrangling que consiste en realizar procedimientos de depuración, limpieza y ordenamiento de datos. La validación de la solución implementada se realiza comparando la información generada por datasets crudos con la información generada por los mismos datasets luego de haber sido reorganizados mediante Data Wrangling.
The proposed research studies the problem of how to make Peru's open data more reusable, as well as to generate its exploitation for the different fields where information needs to be generated from it. The described problem occurs primarily in state entities, due to the lack of resources and knowledge, losing the opportunity to generate consistent and transparent information from the reuse of data already generated. Among the difficulties that state entities have, we have access to complete and reliable information, which prevents them from having more effective and less costly services. It also delays the prevention of unfavorable events, in order to reduce both physical and financial losses. For the solution of the described problem, in this thesis a method of reorganization of open data has been implemented, in order to help the exploitation and reuse of data; this in order to obtain data ready to generate information to be used by entities and individuals who require it. The implemented method is based on the application of Data Science concepts and techniques. In the present research, the Data Wrangling technique has been chosen, which consists of performing data cleaning, cleansing and sorting procedures. The validation of the implemented solution is performed by comparing the information generated by raw datasets with the information generated by the same datasets after having been reorganized by Data Wrangling.
URI : http://hdl.handle.net/20.500.14076/22333
Derechos: info:eu-repo/semantics/restrictedAccess
Aparece en las colecciones: Maestría

Ficheros en este ítem:
Fichero Descripción Tamaño Formato  
espinoza_pb.pdf9,34 MBAdobe PDFVisualizar/Abrir
espinoza_pb(acta).pdf1,84 MBAdobe PDFVisualizar/Abrir


Este ítem está sujeto a una licencia Creative Commons Licencia Creative Commons Creative Commons

Indexado por:
Indexado por Scholar Google LaReferencia Concytec BASE renati ROAR ALICIA RepoLatin UNI