Artículo:
PL4DC: Parameterizable Library for Data Cleaning

Fecha

2023-09-12

Editor

Sistedes

Publicado en

Actas de las XXVII Jornadas de Ingeniería del Software y Bases de Datos (JISBD 2023)

Licencia Creative Commons

Resumen

La capacidad de recopilar, analizar e interpretar datos ha revolucionado la forma que la sociedad tiene de entender e interactuar con el mundo que nos rodea. Esto ha llevado a que los datos sean la base de todo tipo de decisiones a nivel personal, empresarial, e incluso gubernamental. Para poder tener de-cisiones confiables, la calidad de los datos usados es fundamental. La mejora de calidad de los datos es la parte de la gestión de la calidad de los datos que asegura niveles adecuados de calidad para los datos en un contexto de uso. La limpieza de datos es una tarea fundamental de la mejora de datos. En este artículo se presenta PL4DC, una biblioteca de R desarrollada para implemen-tar operaciones de limpieza de datos basada en ISO/IEC 25024. Estas opera-ciones formarán parte de los parámetros de las primitivas producidas por la investigación desarrollada. Finalmente, se describe cómo se usó PL4DC para el caso concreto de un conjunto de datos de un portal inmobiliario.

Descripción

Acerca de Barchino, Gregorio

Palabras clave

Calidad De Datos, ISO/IEC 25024, Limpieza De Datos, Estandarización De Datos
Página completa del ítem
Notificar un error en este artículo
Mostrar cita
Mostrar cita en BibTeX
Descargar cita en BibTeX