Debido al alto tráfico generado por robots, aplicamos límites en el número de peticiones permitidas por cliente y bloqueos por IP automáticos. Si haces un uso legítimo y estás teniendo problemas, avísanos para reevaluar nuestras políticas de bloqueo. Disculpa las molestias.

Artículo:
Arquitectura de un Framework para la Generación Automatizada de Datasets Temporales en Data Lakes

bs.conference.acronymJISBD
bs.conference.nameJornadas de Ingeniería del Software y Bases de Datos (JISBD)
bs.edition.date2023-09-12
bs.edition.locationCiudad Real
bs.edition.nameXXVII Jornadas de Ingeniería del Software y Bases de Datos (JISBD 2023)
bs.proceedings.editorDurán Toro, Amador
bs.proceedings.nameActas de las XXVII Jornadas de Ingeniería del Software y Bases de Datos (JISBD 2023)
dc.contributor.affiliationUniversidad de Cantabria, Spain
dc.contributor.affiliationUniversidad de Cantabria, Spain
dc.contributor.affiliationUniversidad de Cantabria, Spain
dc.contributor.affiliationUniversidad de Cantabria, Spain
dc.contributor.affiliationLIS Data Solutions, Spain
dc.contributor.affiliationLIS Data Solutions, Spain
dc.contributor.affiliationUniversidad de Cantabria, Spain
dc.contributor.authorSal, Brian
dc.contributor.authorde la Vega, Alfonso
dc.contributor.authorLópez Martínez, Patricia
dc.contributor.authorGarcía-Saiz, Diego
dc.contributor.authorGrande, Alicia
dc.contributor.authorLópez, David
dc.contributor.authorSánchez, Pablo
dc.contributor.emailsalb@unican.es
dc.contributor.emaildelavegaa@unican.es
dc.contributor.emaillopezpa@unican.es
dc.contributor.emailgarciasd@unican.es
dc.contributor.emailalicia.grande@lisdatasolutions.com
dc.contributor.emaildavid.lopez@lisdatasolutions.com
dc.contributor.emailsanchezbp@unican.es
dc.contributor.signatureSal, Brian
dc.contributor.signaturede la Vega, Alfonso
dc.contributor.signatureLópez, Patricia
dc.contributor.signatureGarcía-Saiz, Diego
dc.contributor.signatureGrande, Alicia
dc.contributor.signatureLópez, David
dc.contributor.signatureSánchez, Pablo
dc.date.accessioned2023-09-09T21:11:13Z
dc.date.available2023-09-09T21:11:13Z
dc.date.issued2023-09-12
dc.description.abstractEn los últimos años, los data lakes se han popularizado como solución para el almacenamiento centralizado de grandes volúmenes de datos heterogéneos procedentes de fuentes dispares. Estos datos suelen tener un marcado carácter temporal, ya que los datos suelen extraerse periódicamente de diversas fuentes a diferentes frecuencias y se almacenan directamente en crudo. Por tanto, estos datos deben ser adecuadamente preprocesados antes de ser consumidos por las aplicaciones que los explotan. Esta tarea de preprocesamiento se realiza actualmente de manera manual, mediante la escritura de scripts en lenguajes de transformación de datos. Este proceso es laborioso, costoso y, por lo general, propenso a errores. Para tratar de aliviar este problema, este artículo presenta la arquitectura inicial de Hannah, un framework que busca automatizar la generación de datasets para la minería de series temporales a partir de datos en bruto provenientes de data lakes. El objetivo es que, utilizando la menor cantidad de información posible como entrada, el framework sea capaz de recuperar los datos requeridos del data lake y procesarlos para que encajen adecuadamente dentro de un dataset.
dc.identifier.citationSal, B., de la Vega, A., López, P., García-Saiz, D., Grande, A., López, D., Sánchez, P.: Arquitectura de un Framework para la Generación Automatizada de Datasets Temporales en Data Lakes. In: Durán Toro, A. (ed.) Actas de las XXVII Jornadas de Ingeniería del Software y Bases de Datos (JISBD 2023). Sistedes (2023). https://hdl.handle.net/11705/JISBD/2023/7013
dc.identifier.citation-bibtex@inproceedings{11705:JISBD:2023:7013, title = {{Arquitectura de un Framework para la Generaci\'{o}n Automatizada de Datasets Temporales en Data Lakes}}, author = {Sal, B. and de la Vega, A. and L\'{o}pez, P. and Garc\'{i}a-Saiz, D. and Grande, A. and L\'{o}pez, D. and S\'{a}nchez, P.}, url = {https://hdl.handle.net/11705/JISBD/2023/7013}, crossref = {11705:JISBD:2023} } @proceedings{11705:JISBD:2023, title = {{Actas de las XXVII Jornadas de Ingenier\'{i}a del Software y Bases de Datos (JISBD 2023)}}, author = {Dur\'{a}n Toro, A.}, year = {2023}, publisher = {{Sistedes}}, }
dc.identifier.sistedes11705/JISBD/2023/7013
dc.identifier.urihttps://hdl.handle.net/11705/2529
dc.publisherSistedes
dc.relation.ispartofActas de las XXVII Jornadas de Ingeniería del Software y Bases de Datos (JISBD 2023)
dc.rights.licenseCC BY-NC-ND 4.0
dc.rights.urihttps://creativecommons.org/licenses/by-nc-nd/4.0/
dc.subjectData Lake
dc.subjectIngeniería De Datos
dc.subjectCiencia De Datos
dc.subjectSeries Temporales
dc.titleArquitectura de un Framework para la Generación Automatizada de Datasets Temporales en Data Lakes
dspace.entity.typeArtículo
relation.isAuthorOfPaper6286bbbf-99e9-4951-a07a-c9e92e2c06db
relation.isAuthorOfPaper1d01a441-4c66-47e7-9214-56df12e7bea1
relation.isAuthorOfPaper485e6488-be49-4820-a529-512553f236c2
relation.isAuthorOfPaperad2b8cda-79f1-4e18-b0f7-e55c1de9b5e8
relation.isAuthorOfPaper5ae6ebad-78f3-4eec-9117-1588a24caee9
relation.isAuthorOfPaper172f1d01-7cdd-43a6-b5d4-f9feaa3629b1
relation.isAuthorOfPaper0ebd472c-d3c2-42b4-acf7-5e12c17c8e96
relation.isAuthorOfPaper.latestForDiscovery6286bbbf-99e9-4951-a07a-c9e92e2c06db

Archivos

Bloque original

Mostrando 1 - 1 de 1
Cargando...
Miniatura
Nombre:
11705-JISBD-2023-7013.pdf
Tamaño:
218.32 KB
Formato:
Adobe Portable Document Format