Navegación

Búsqueda

Búsqueda avanzada

Resultados de búsqueda para pipeline

CODICE: Un nuevo enfoque metodológico para el Procesamiento Inteligente de Documentos.

La automatización de los procesos organizativos suele implicar el tratamiento de documentos en los que se emplean distintas técnicas de procesamiento. Con el creciente interés y uso de la Inteligencia Artificial (IA) y la Automatización Robótica de Procesos (RPA) para mejorar este trabajo, se están utilizando diferentes metodologías y técnicas para resolver problemas relacionados con la integración y uso cohesionado de dichas tecnologías en el campo del procesamiento inteligente de documentos (IDP). Por ello, este trabajo presenta el proyecto CODICE que aborda la necesidad de crear una metodología para pipelines IDP, definiendo cómo incorporar la asistencia de IA y RPA, y una arquitectura que de soporte a ésta.

Autores: José Manuel López Carnicer / Antonio Martínez Rojas / José González Enríquez / Andrés Jiménez Ramírez / Jesús Miguel Sánchez Oliva / 
Palabras Clave: Intelligent Document Processing - methodology - pipeline - Robotic Process Automation

The bdpar Package: Big Data Pipelining Architecture for R

In the last years, big data has become a useful paradigm for taking advantage of multiple sources to find relevant knowledge in real domains (such as the design of personalized marketing campaigns or helping to palliate the effects of several fatal diseases). Big data programming tools and methods have evolved over time from a MapReduce to a pipeline-based archetype. Concretely the use of pipelining schemes has become the most reliable way of processing and analyzing large amounts of data. To this end, this work introduces bdpar, a new highly customizable pipeline-based framework (using the OOP paradigm provided by R6 package) able to execute multiple preprocessing tasks over heterogeneous data sources. Moreover, to increase the flexibility and performance, bdpar provides helpful features such as (i) the definition of a novel object-based pipe operator (+ACUAPgB8ACU), (ii) the ability toeasily design and deploy new (and customized) input data parsers, tasks, and pipelines, (iii) only-once execution which avoids the execution of previously processed information (instances), guaranteeing that only new both input data and pipelines are executed, (iv) the capability to perform serial or parallel operations according to the user needs, (v) the inclusion of a debugging mechanism whichallows users to check the status of each instance (and find possible errors) throughout the process.

Autores: Miguel Ferreiro-Díaz / Tomás R Cotos-Yáñez / José R. Méndez / David Ruano Ordas / 
Palabras Clave: Heterogeneous data sources - package R - pipeline

No encuentra los resultados que busca? Prueba nuestra Búsqueda avanzada