Navegación

Búsqueda

Búsqueda avanzada

El autor Diego Sevilla ha publicado 2 artículo(s):

1 - Utilización de Neo4j para consultar esquemas de bases de datos NoSQL

Debido a la ausencia de un esquema formalmente definido, en las bases de datos NoSQL pueden existir variaciones estructurales pa- ra una misma entidad. Dado que el número de variaciones puede llegar a varios miles, la visualización de esquemas NoSQL que muestren todas las variaciones no es factible y conviene utilizar lenguajes de consulta para extraer información sobre el esquema. En este trabajo presentamos una alternativa a la creación de un lenguaje para ese propósito. Se propone transformar los esquemas extraídos de la base de datos en una base de datos de grafos Neo4j con el fin de aprovechar las utilidades de visuali- zación y el lenguaje de consultas Cypher. Se describe la estrategia y se aplica a un caso de estudio de un dataset Stackoverflow almacenado en MongoDB, y se muestran un conjunto de consultas Cypher representati- vas. Los esquemas se infieren con una estrategia ideada en nuestro grupo, la cual se diferencia del resto de propuestas publicadas en la extracción de todas las variaciones de entidades y relaciones existentes, en vez de obtener sólo el esquema formado por entidades que son resultado de la union de todas sus variaciones.

Autores: Carlos Javier Fernández Candel / Diego Sevilla / Jesus Garcia-Molina / 
Palabras Clave: Bases de datos NoSQL - Consultas - Cypher - Esquemas NoSQL - Neo4j

2 - Análisis de esquemas NoSQL para el procesamiento de variaciones de entidad atípicas

Las variaciones estructurales de una entidad pueden darse en la mayoría de bases de datos NoSQL debido a que no requieren la definición formal de un esquema. Estas variaciones existen debido, por ejemplo, a la existencia de propiedades opcionales o tipos de datos no uniformes. La detección de estas variaciones es crucial en las estrategias de extracción del esquema de la base de datos a partir de los datos almacenados. Hasta ahora, las estrategias propuestas no han abordado la detección de variaciones atípicas procedentes de datos erróneos u obsoletos. Este trabajo corto plantea un enfoque para la detección de variaciones atípicas y su conversión a variaciones no atípicas. Para ello, se extenderá el proceso de inferencia basado en modelos desarrollado en nuestro grupo. Se mostrará su aplicación al dataset real Reddit.

Autores: Alberto Hernández Chillón / Diego Sevilla / Jesus Garcia-Molina / 
Palabras Clave: Detección de variaciones atípicas - Evolución de esquemas - MongoDB - Sistemas NoSQL