Navegación

Búsqueda

Búsqueda avanzada

El autor Jose F. Aldana-Montes ha publicado 7 artículo(s):

1 - Ontology-Driven Approach for KPI Meta-modelling, Selection and Reasoning

Modern applications of Big Data are transcendingfrom being scalable solutions of data processing and analysis, to nowprovide advanced functionalities with the ability to exploit and understandthe underpinning knowledge. This change is promoting the developmentof tools in the intersection of data processing, data analysis,knowledge extraction and management. In this paper, we proposeTITAN, a software platform for managing all the life cycle of scienceworkflows from deployment to execution in the context of Big Data applications.This platform is characterised by a design and operation modedriven by semantics at different levels: data sources, problem domain andworkflow components. The proposed platform is developed upon an ontologicalframework of meta-data consistently managing processes andmodels and taking advantage of domain knowledge. TITAN comprises awell-grounded stack of Big Data technologies including Apache Kafka forinter-component communication, Apache Avro for data serialisation andApache Spark for data analytics. A series of use cases are conducted forvalidation, which comprises workflow composition and semantic metadatamanagement in academic and real-world fields of human activityrecognition and land use monitoring from satellite images.

Autores: Maria del Mar Roldan-Garcia / José García-Nieto / Alejandro Maté / Juan Trujillo / José F. Aldana-Montes / 
Palabras Clave: Knowledge extraction - KPI Modelling - Ontology - reasoning - Semantics - Water Management

2 - TITAN: A knowledge-based platform for Big Data workflow management

Modern applications of Big Data are transcendingfrom being scalable solutions of data processing and analysis, to nowprovide advanced functionalities with the ability to exploit and understandthe underpinning knowledge. This change is promoting the developmentof tools in the intersection of data processing, data analysis,knowledge extraction and management. In this paper, we proposeTITAN, a software platform for managing all the life cycle of scienceworkflows from deployment to execution in the context of Big Data applications.This platform is characterised by a design and operation modedriven by semantics at different levels: data sources, problem domain andworkflow components. The proposed platform is developed upon an ontologicalframework of meta-data consistently managing processes andmodels and taking advantage of domain knowledge. TITAN comprises awell-grounded stack of Big Data technologies including Apache Kafka forinter-component communication, Apache Avro for data serialisation andApache Spark for data analytics. A series of use cases are conducted forvalidation, which comprises workflow composition and semantic metadatamanagement in academic and real-world fields of human activityrecognition and land use monitoring from satellite images.

Autores: Antonio Benítez-Hidalgo / Cristóbal Barba-González / José García-Nieto / Pedro Gutierez-Moncayo / Manuel Paneque / Antonio J. Nebro / Maria del Mar Roldan-Garcia / Jose F. Aldana-Montes / Ismael Navas-Delgado / 
Palabras Clave: Big Data analytics - Knowledge extraction - Semantics

3 - Tool for materializing OWL ontologies in a column-oriented database

El término Linked Data, o Datos Vinculados, hace referencia a conjuntos de datos interconectados y estructurados semánticamente, que están descritos con el lenguaje RDF (Resource Description Framework). Sobre los datos RDF se suelen construir vocabularios y ontologías con lenguajes como OWL (Web Ontology Language), que ayudan a estructurar el dominio de conocimiento de los datos. El éxito de los Linked Data es tal, que la Linked data cloud, o la Nube de Datos Vinculados, es actualmente la fuente de datos estructurada más grande de la historia y, por tanto, ofrece un entorno muy interesante tanto para realizar consultas, como para realizar razonamiento formal sobre los datos, aprovechando las capacidades de las ontologías.Debido al tamaño de los Linked Data, estas técnicas de razonamiento deben ser altamente escalables, y basadas en algoritmos paralelos y distribuidos. Además, la rapidez con la que evolucionan los Linked Data insinúa que estas técnicas de razonamiento deben ser incrementales para ofrecer resultados en tiempo real. Desde nuestro punto de vista, el primer paso para cumplir con estos desafíos es diseñar un modelo de almacenamiento de OWL/RDF optimizado, distribuido y masivo, que permita la implementación de algoritmos de razonamiento altamente escalables.En este contexto, han surgido las bases de datos NoSQL (Not Only SQL) como la infraestructura más utilizada para gestionar Big RDF Data. Además, las bases de datos NoSQL ofrecen la posibilidad de materializar de manera eficiente los resultados del razonamiento, abriendo as+AO0 el camino hacia el razonamiento incremental. Finalmente, las bases de datos NoSQL se han diseñado específicamente para proporcionar almacenamiento distribuido y escalable de grandes conjuntos de datos.En este artículo presentamos nuestra propuesta para materializar ontologías OWL, previamente clasificadas, en una base de datos NoSQL. Este proceso de materialización permite el almacenamiento distribuido de datos RDF aprovechando la distribución inherente de los nodos de la base de datos NoSQL. Además, esta propuesta supone el primer paso hacia un enfoque novedoso para el razonamiento OWL escalable, que permite, por tanto, el razonamiento escalable sobre Linked Data. Para validar nuestra propuesta, hemos desarrollado un prototipo de una herramienta que almacena una ontología OWL en una base de datos Cassandra siguiendo nuestro enfoque. Finalmente, presentamos nuestra estrategia de razonamiento para computar el cierre transitivo de la ontología OWL utilizando esta base de datos Cassandra.

Autores: Liudmila Reyes-Álvarez / Maria del Mar Roldán-García / Jose F. Aldana-Montes / 
Palabras Clave: Linked Data - MapReduce Framework - NoSQL Databases - OWL ontologies - Scalable reasoning

4 - Actualización incremental de grafos RDF a partir de bases de datos relacionales

El modelo de datos relacional constituye el paradigma utilizado con mayor frecuencia por los sistemas operacionales que actualmente utilizan las empresas para gestionar sus procesos. Por otra parte, las tecnologías de la web semántica han logrado un importante impulso en los últimos años. Se han desarrollado estándares tales como Resource Description Framework (RDF) y Web Ontology Language (OWL). RDF constituye el modelo de datos utilizado para la publicación y enlazado de datos estructurados en la Web, un enfoque denominado datos vinculados (Linked Data) y que constituye la base sobre la que se sustenta la Web Semántica. Estudios recientes demuestran que es posible trasladar el modelo de datos relacional al modelo de datos basado en grafos RDF. Por tal motivo es posible realizar operaciones de inserción, actualización y eliminación en ambos sentidos relacional-grafo y grafo-relacional. Aproximaciones existentes solo se suscriben a la actualización total de los grafos RDF, es decir, un cambio generado en la base de datos relacional implica que sea necesario generar nuevamente el grafo RDF en su totalidad, incurriendo en altos costos de tiempo y recursos computaciones. Es por tanto necesario la definición de nuevos métodos que detecten estas actualizaciones y luego las trasladen al modelo de datos RDF. En este artículo se propone un modelo para la actualización incremental de grafos RDF a partir de la detección de cambios en las bases de datos relacionales, evitando así la generación total del grafo RDF.

Autores: Liudmila Reyes-Álvarez / Yusniel Hidalgo-Delgado / Katerín Martínez-Rojas / María del Mar Roldán-García / José F. Aldana-Montes / 
Palabras Clave: actualización incremental - modelo RDF - modelo relacional - Web Semántica

5 - Social Pathway Annotation: Extensions of the Systems Biology Metabolic Modelling Assistant

High-throughput experiments have produced large amounts of heterogeneous data in the life sciences. The integration of data in the life sciences is a key component in the analysis of biological processes. These data may contain errors, but the curation of the vast amount of data generated in the «omic» era cannot be done by individual researchers. To address this problem, community-driven tools could be used to assist with data analysis. In this paper, we focus on a tool with social networking capabilities built on top of the SBMM (Systems Biology Metabolic Modelling) Assistant to enable the collaborative improvement of metabolic pathway models (the application is freely available at http://sbmm.uma.es/SPA).

Autores: Ismael Navas-Delgado / Alejandro del Real-Chicharro / Miguel Ángel Medina / Francisca Sánchez-Jiménez / José F. Aldana-Montes / 
Palabras Clave: Data Integration - Life Sciences - Social Data Curation

6 - Un Repositorio RDF para la Integración y Consulta de Datos de Pacientes Hepáticos

Los casos médicos pasados, y por lo tanto, la experiencia clínica, son recursos de valor incalculable para apoyar la práctica clínica, la investigación y la formación. Los profesionales médicos deben poder intercambiar información sobre casos médicos de pacientes y explorarlos desde distintas perspectivas subjetivas. Esto requiere de una metodología sistemática y flexible para la representación de los casos médicos que soporte el intercambio de información procesable del paciente. En este artículo presentamos un enfoque basado en ontologías para modelar casos médicos de pacientes que utiliza pacientes con enfermedades hepáticas como ejemplo. Para este fin, se propone una nueva ontología, LiCO, que utiliza estándares médicos bien conocidos para representar casos de pacientes con enfermedades hepáticas. La utilidad del enfoque propuesto se demuestra con consultas semánticas y razonamiento utilizando datos recopilados de pacientes reales. Los resultados preliminares son prometedores con respecto al potencial de la representación de casos médicos basada en ontologías para la construcción de sistemas de búsqueda y recuperación de información de casos médicos, allanando el camino hacia una plataforma de intercambio de experiencias clínicas para comparar diagnósticos, para investigación y para formación.

Autores: Maria Del Mar Roldan-Garcia / Jose F. Aldana-Montes / 
Palabras Clave: Integración de datos - Ontologías - RDF - Representación de casos médicos

7 - Bioqueries a Social Community for SPARQL queries in Life Sciencess

Life Sciences have emerged as a key domain in the Linked Data community because of the diversity of data semantics and formats available through a great variety of databases and web technologies. Unfortunately, bioinformaticians are not exploiting the full potential of this technology and experts in Life Sciences have real problems to discover, understand and devise how to take advantage of these interlinked data. In this context, we have implemented Bioqueries, a wiki-based portal that is aimed at community building around biological Linked Data (http://bioqueries.uma.es/). This space offers a collaborative platform in which users can create, modify, execute and share biological SPARQL queries.

Autores: María Jesús García Godoy / Esteban López-Camacho / Ismael Navas-Delgado / José F. Aldana-Montes / 
Palabras Clave: