Gestión de Datos

URI permanente para esta colección:

Artículos en la categoría Gestión de Datos publicados en las Actas de las XXIII Jornadas de Ingeniería del Software y Bases de Datos (JISBD 2018).
Notificar un error en esta colección

Examinar

Envíos recientes

Mostrando 1 - 20 de 23
  • Artículo
    Patrón de seguridad para la autorización de bases de datos NoSQL (par clave-valor)
    Moreno, Julio; Fernandez, Eduardo B.; Serrano Martín, Manuel Ángel; Fernandez-Medina, Eduardo. Actas de las XXIII Jornadas de Ingeniería del Software y Bases de Datos (JISBD 2018), 2018-09-17.
    Aunque las bases de datos de tipo NoSQL surgieron hace unos años, son cada vez más usadas en diversos contextos, debido al crecimiento de los sistemas web y su uso en sistemas analíticos como Big Data. Sin embargo, generalmente este tipo de sistemas de almacenamiento no ha sido concebido con la seguridad en mente, pues se centran en resolver otros problemas como la velocidad de acceso o su uso en entornos distribuidos. Uno de los principales problemas de seguridad que se pueden identificar en estos entornos es la falta de un mecanismo de control de acceso nativo. Aunque existen numerosas propuestas hechas por investigadores que solucionan esta problemática para una tecnología concreta, faltan propuestas con un mayor nivel de abstracción que propongan soluciones más generales. En este sentido, una solución para este tipo de problemas generales es la creación de un patrón de seguridad. En este artículo proponemos un patrón de seguridad específico para realizar el control de acceso de bases de datos NoSQL de tipo clave-valor y se definen los diferentes elementos que lo conforman.
  • Artículo
    Plataforma Escalable para el Almacenamiento y Procesamiento de Imágenes Multi e Hiperespectrales con Propiedades de Acceso Espacio-Temporal
    Sánchez Cabrera, Miguel; Barrena, Manuel; Cuartero Sáez, Aurora. Actas de las XXIII Jornadas de Ingeniería del Software y Bases de Datos (JISBD 2018), 2018-09-17.
    Este artículo describe el desarrollo de una plataforma escalable y eficiente para el almacenamiento y gestión masiva de imágenes multi e hiperespectrales a diferente escala; imágenes de satélite a gran altura e imágenes a media y baja altura procedentes de vuelos con vehículos aéreos no tripulados, con propiedades de acceso espacio-temporal, que sea capaz de ofrecer una mejora en los procesos de gestión y productividad de explotaciones agrarias. Esta información se combina con el uso de tecnologías actuales como bases de datos NoSQL para la gestión del almacenamiento, así como el diseño de los modelos de datos necesarios que sean capaces de soportar la variabilidad de la característica espacio-tiempo de los datos citados, y de aquellas fuentes externas que necesitan ser analizadas y procesadas antes de incorporarse al sistema. Ofreciendo mediante esta integración de datos y tecnología una infraestructura digital que logre facilitar, dentro del ámbito agrícola, los procesos de toma de decisión y la optimización de la gestión de las zonas de cultivo.
  • Resumen
    Application of Data Mining techniques to identify relevant Key Performance Indicators
    Peral, Jesus; Maté, Alejandro; Marco, Manolo. Actas de las XXIII Jornadas de Ingeniería del Software y Bases de Datos (JISBD 2018), 2018-09-17.
    Datos: Revista: Computer Standards & Interfaces (CSI) Volumen, páginas y fecha: Vol. 54(2), pp 76-85, Noviembre de 2017 DOI: https://doi.org/10.1016/j.csi.2016.11.006 Indicios de calidad: - Revista en Ranking: Q2, 40/106 COMPUTER SCIENCE, SOFTWARE ENGINEERING - Factor de Impacto: 1.633 - Citas: 2 (Scopus)
  • Resumen
    Enhancing semantic consistency in anti-fraud rule-based expert systems
    Roldán-García, María del Mar; García-Nieto, José Manuel; Aldana-Montes, José F.. Actas de las XXIII Jornadas de Ingeniería del Software y Bases de Datos (JISBD 2018), 2018-09-17.
    En este estudio, se propone un servicio guiado por ontología para la detección y clasificación de problemas de incoherencia semántica en sistemas expertos con bases de reglas de decisión. Se centra en el caso crítico de repositorios de reglas antifraude para la inspección de transacciones en entornos de comercio electrónico. La motivación principal consiste en examinar y seleccionar los conjuntos de datos de reglas antifraude para evitar conflictos semánticos que podrían llevar al sistema experto subyacente a funcionar incorrectamente, e. g., al aceptar transacciones fraudulentas y/o descartando las inofensivas. Se ha desarrollado una ontología OWL específica y una serie de reglas semánticas (SWRL) de razonamiento para evaluar dichas bases de reglas antifraude. Las tres principales contribuciones de este trabajo son: primero, la creación de un modelo de conocimiento conceptual para describir las reglas antifraude y sus relaciones; segundo, el desarrollo de reglas semánticas como métodos de detección de conflictos para sistemas expertos contra el fraude; en tercer lugar, se recopilan datos experimentales para evaluar y validar el modelo propuesto. Se utiliza un caso de uso real de la industria de comercio electrónico (e-Turismo) para explicar el diseño de la ontología y su uso. Los experimentos muestran que los enfoques ontológicos pueden descubrir y clasificar efectivamente conflictos en sistemas expertos basados en reglas para detección de fraude. La propuesta también se puede aplicar en otros dominios donde se trabaje con bases de reglas de conocimiento. Este trabajo se presenta como artículo relevante, con referencia: María del Mar Roldán-García, José García-Nieto, José F. Aldana-Montes. Enhancing semantic consistency in anti-fraud rule-based expert systems. Expert Systems with Applications, Volume 90, 2017, Pages 332-343, ISSN 0957-4174, https://doi.org/10.1016/j.eswa.2017.08.036. La revista Expert Systems with Applications está indexada en JCR-ISI en categorías: COMPUTER SCIENCE, ARTIFICIAL INTELLIGENCE - SCIE; ENGINEERING, ELECTRICAL & ELECTRONIC - SCIE; OPERATIONS RESEARCH & MANAGEMENT SCIENCE - SCIE; con ranking Q1 en todas ellas y cuenta con un factor de impacto 2016 de 3.928.
  • Artículo
    Descripción de pruebas de benchmark para plataformas de tercera generación
    Martin de La Rubia, Luis; Algorri, Miguel; Zorrilla, Marta Elena; Drake, José María. Actas de las XXIII Jornadas de Ingeniería del Software y Bases de Datos (JISBD 2018), 2018-09-17.
    La irrupción del big data y la computación en la nube ha impulsado un cambio de paradigma en la construcción de nuevos sistemas basados en plataformas distribuidas escalables y orientadas al dato como servicio. La existencia de diversas tecnologías y la necesidad de evaluar el rendimiento de las aplicaciones construidas con ellas tanto en fase de prototipo como ya una vez implementadas y desplegadas en el entorno operativo, nos ha llevado a proponer un modelo de datos para describir pruebas de benchmark destinadas a la comparación de estas plataformas de tercera generación. El modelo incorpora información sobre todos los aspectos de la prueba: recursos, fuentes de datos, cargas de trabajo y métricas; cubre varios casos de uso y permite adaptar la información que contiene a las diferentes fases del ciclo de desarrollo del sistema. En las fases iniciales de desarrollo de prototipos, el modelo describe estimaciones de la carga de trabajo, de las prestaciones previstas para los recursos y componentes del sistema y de las métricas que se quieren valorar; mientras que en las fases finales de validación, el modelo sólo ha de incluir la identificación de las fuentes que generan las cargas de trabajo, de los recursos utilizados y de los componente desplegados, a fin de evaluar las métricas de interés.
  • Resumen
    Scalable and queryable compressed storage structure for raster data
    Ladra, Susana; Paramá, José R.; Silva-Coira, Fernando. Actas de las XXIII Jornadas de Ingeniería del Software y Bases de Datos (JISBD 2018), 2018-09-17.
    Titulo: Scalable and queryable compressed storage structure for raster data Autores: Susana Ladra, José R. Paramá, Fernando Silva-Coira Revista: Information Systems Volume 72, December 2017, Pages 179-204 Factor de impacto: 2.777 Ranking JCR: Q2 Citas: 1 DOI: https://doi.org/10.1016/j.is.2017.10.007
  • Artículo
    AIRPORTS: Análisis de Eficiencia Operacional basado en Trayectorias de Vuelo
    Alonso-Isla, Álvaro; Álvarez-Esteban, Pedro C.; Bregón, Aníbal; D'Alto, Luís; Díaz, Fernando; García-Miranda, Iván; Gordaliza, Paula; López-Leonés, Javier. Actas de las XXIII Jornadas de Ingeniería del Software y Bases de Datos (JISBD 2018), 2018-09-17.
    AIRPORTS es un proyecto liderado por Boeing Research & Technology Europe (BR&T-E) en el que se coordinan varias líneas de investigación centradas en mejorar la eficiencia del sistema de transporte aéreo futuro. En particular, nuestro trabajo en AIRPORTS aborda la explotación de los datos que describen las trayectorias de vuelo para caracterizar la eficiencia de las operaciones realizadas en el entorno aeroportuario. Este documento introduce las particularidades básicas del contexto en el que estamos desarrollando nuestra investigación y presenta, brevemente, tanto el entorno tecnológico en el que se está realizando el proyecto, como los resultados que se esperan del mismo.
  • Resumen
    A continuous deployment-based approach for the collaborative creation, maintenance, testing and deployment of CityGML models
    Prieto, Iñaki; Izkara, Jose Luis; Béjar, Rubén. Actas de las XXIII Jornadas de Ingeniería del Software y Bases de Datos (JISBD 2018), 2018-09-17.
    Publicado en: International Journal of Geographical Information Science Volume 32, 2018 - Issue 2, pp. 282-301 (ya publicado online el 26 Oct 2017) https://doi.org/10.1080/13658816.2017.1393543 La revista está 46/146 en COMPUTER SCIENCE, INFORMATION SYSTEMS en el JCR (Q2) Abstract: Georeferenced 3D models are an increasingly common choice to store and display urban data in many application areas. CityGML is an open and standardized data model, and exchange format that provides common semantics for 3D city entities and their relations and one of the most common options for this kind of information. Currently, creating and maintaining CityGML models is costly and difficult. This is in part because both the creation of the geometries and the semantic annotation can be complex processes that require at least some manual work. In fact, many publicly available CityGML models have errors. This paper proposes a method to facilitate the regular maintenance of correct city models in CityGML. This method is based on the continuous deployment strategy and tools used in software development, but adapted to the problem of creating, maintaining and deploying CityGML models, even when several people are working on them at the same time. The method requires designing and implementing CityGML deployment pipelines. These pipelines are automatic implementations of the process of building, testing and deploying CityGML models. These pipelines must be run by the maintainers of the models when they make changes that are intended to be shared with others. The pipelines execute increasingly complex automatic tests in order to detect errors as soon as possible, and can even automate the deployment step, where the CityGML models are made available to their end users. In order to demonstrate the feasibility of this method, and as an example of its application, a CityGML deployment pipeline has been developed for an example scenario where three actors maintain the same city model. This scenario is representative of the kind of problems that this method intends to solve, and it is based on real work in progress. The main bene fits of this method are the automation of model testing, every change to the model is tested in a repeatable way; the automation of the model deployment, every change to the model can reach its end users as fast as possible; the systematic approach to integrating changes made by different people working together on the models, including the possibility of keeping parallel versions with a common core; anautomatic record of every change made to the models (who did what and when) and the possibility of undoing some of those changes at any time.
  • Artículo
    Designing a Tool for Linking Genetic Variations to Diseases
    Iñiguez, Carlos; Pastor López, Óscar. Actas de las XXIII Jornadas de Ingeniería del Software y Bases de Datos (JISBD 2018), 2018-09-17.
    The technological advance in biomedicine field has led to the creation of large and dispersed heterogeneous data silos. The researchers manually explore the information from these silos to find the relationship between DNA alterations and diseases. This task is tedious and time-consuming due to a large number of dispersed data sources, the volume of information to analyze and the heterogeneity of the content format. In this article, we report the design of a tool based on mashups and interactions to identify the cause-effect relationship between diseases and alterations in the human genome considering the challenges of data integration and the support to different formats of content. The proposed tool is not limited to the genetic domain, rather it can be applied to several domains characterized by dispersed data sources and heterogeneous data formats.
  • Resumen
    Efficient query processing on large spatial databases: A performance study
    Roumelis, George; Vassilakopoulos, Michael; Corral, Antonio; Manolopoulos, Yannis. Actas de las XXIII Jornadas de Ingeniería del Software y Bases de Datos (JISBD 2018), 2018-09-17.
    Processing of spatial queries has been studied extensively in the literature. In most cases, it is accomplished by indexing spatial data using spatial access methods. Spatial indexes, such as those based on the Quadtree, are important in spatial databases for efficient execution of queries involving spatial constraints and objects. In this paper, we study a recent balanced disk-based index structure for point data, called xBR+-tree, that belongs to the Quadtree family and hierarchically decomposes space in a regular manner. For the most common spatial queries, like Point Location, Window, Distance Range, Nearest Neighbor and Distance-based Join, the R-tree family is a very popular choice of spatial index, due to its excellent query performance. For this reason, we compare the performance of the xBR+-tree with respect to the R?-tree and the R+-tree for tree building and processing the most studied spatial queries. To perform this comparison, we utilize existing algorithms and present new ones. We demonstrate through extensive experimental performance results (I/O efficiency and execution time), based on medium and large real and synthetic datasets, that the xBR+-tree is a big winner in execution time in all cases and a winner in I/O in most cases.
  • Resumen
    Aggregation-based information retrieval system for geospatial data catalogs
    Lacasta, Javier; López-Pellicer, Francisco Javier; Espejo García, Borja; Nogueras Iso, Javier; Zarazaga-Soria, Francisco Javier. Actas de las XXIII Jornadas de Ingeniería del Software y Bases de Datos (JISBD 2018), 2018-09-17.
    Tipo de contribución: Artículo relevante Autores: Lacasta, Javier; Lopez-Pellicer, F. Javier; Espejo-García, Borja; Nogueras-Iso, Javier; Zarazaga-Soria, F. Javier. Título: Aggregation-based information retrieval system for geospatial data catalogs. Publicación: INTERNATIONAL JOURNAL OF GEOGRAPHICAL INFORMATION SCIENCE. 31 - 8, pp. 1583 - 1605. 2017. ISSN 1365-8816 DOI: 10.1080/13658816.2017.1319949 Indicios de Calidad - Factor de impacto: JCR-SCI 2016 impact factor: 2.502. Rank: Q2 (46/146) in Computer Science, Information Systems ; Q2 (19/49) in Geography, Physical
  • Resumen
    Benchmarking real-time vehicle data streaming models for a smart city
    Fernández-Rodríguez, Jorge Y.; Álvarez-García, Juan A.; Arias Fisteus, Jesús; Rodríguez Luaces, Miguel; Corcoba Magaña, Víctor. Actas de las XXIII Jornadas de Ingeniería del Software y Bases de Datos (JISBD 2018), 2018-09-17.
    Artículo ya publicado Information Systems, Volume 72, December 2017, Pages 62-76 https://doi.org/10.1016/j.is.2017.09.002 Q2, (COMPUTER SCIENCE, INFORMATION SYSTEMS) --- The information systems of smart cities offer project developers, institutions, industry and experts the possibility to handle massive incoming data from diverse information sources in order to produce new information services for citizens. Much of this information has to be processed as it arrives because a real-time response is often needed. Stream processing architectures solve this kind of problems, but sometimes it is not easy to benchmark the load capacity or the efficiency of a proposed architecture. This work presents a real case project in which an infrastructure was needed for gathering information from drivers in a big city, analyzing that information and sending real-time recommendations to improve driving efficiency and safety on roads. The challenge was to support the real-time recommendation service in a city with thousands of simultaneous drivers at the lowest possible cost. In addition, in order to estimate the ability of an infrastructure to handle load, a simulator that emulates the data produced by a given amount of simultaneous drivers was also developed. Experiments with the simulator show how recent stream processing platforms like Apache Kafka could replace custom-made streaming servers in a smart city to achieve a higher scalability and faster responses, together with cost reduction.
  • Resumen
    Semantic mediation of observation datasets through Sensor Observation Services
    Regueiro, Manuel A.; Ríos Viqueira, José Ramón; Stasch, Christoph; Taboada González, Jose A.. Actas de las XXIII Jornadas de Ingeniería del Software y Bases de Datos (JISBD 2018), 2018-09-17.
    This paper describes a first effort for the semantic mediation between heterogeneous environmental observation datasets through the Sensor Observation Service (SOS) standard proposed by the Open Geospatial Consortium. The solution enables application domain experts to provide an ontology with semantic data integration knowledge, which is next combined with data source knowledge during the evaluation of global SOS GetObservation requests. This enables the development of a more general purpose solution that may be adapted to different application domains by just changing the ontology. Besides, users without specific application domain skills and knowledge may now develop new semantically enabled applications. Finally, the design of the framework is based on the well-known Mediator/Wrapper architecture and follows a Local As View data integration approach, which simplifies the incorporation of new datasets without having to change the existing data integration knowledge.
  • Artículo
    Restricción de coetaneidad: cómo detectar y neutralizar inconsistencias temporales
    Abián, David; Bernad, Jorge; Trillo-Lado, Raquel. Actas de las XXIII Jornadas de Ingeniería del Software y Bases de Datos (JISBD 2018), 2018-09-17.
    La preocupación por la propagación de información falsa crece y el análisis de grandes volúmenes de datos correctos se hace imprescindible en los procesos de toma de decisiones de las organizaciones. Pese a ello, no se han extendido mecanismos automáticos que aseguren la consistencia de los datos relativos al tiempo cronológico, que abundan en los grandes sistemas de información. En este artículo se define y formaliza la restricción de coetaneidad, un mecanismo para la detección y el marcado masivos de datos inconsistentes gracias a la comparación cruzada de valores de tiempo con el consiguiente incremento en la calidad de la información en diferentes contextos.
  • Artículo
    Dynamic SLOD-BI: Infraestructura Dinamica de Inteligencia de Negocio Social
    Berlanga, Rafael; Aramburu, Maria Jose; Lanza, Indira; Mª Llidó, Dolores; Museros, Lledó; Sanz, Ismael. Actas de las XXIII Jornadas de Ingeniería del Software y Bases de Datos (JISBD 2018), 2018-09-17.
    Este proyecto plantea nuevas perspectivas de analisis y nuevas extensiones en la funcionalidad de la infraestructura de datos desarrollada en el proyecto SLOD-BI (Social Linked Open Data for Business Intelligence). SLOD-BI plantea una infraestructura de datos enlazados y abiertos (Linked Open Data -LOD-) orientada a capturar y publicar hechos extrados de las redes sociales que son relevantes para los objetivos estrategicos de empresas PYME. La principal limitacion de estas infraestructuras es su naturaleza estatica, ya que los datos son generados y publicados cada cierto tiempo como conjuntos de datos RDF. Sin embargo, los hechos generados en las redes sociales son altamente dinamicos, y muchas veces requieren ser analizados casi en tiempo real (right time). En el proyecto Dynamic SLOD-BI se aborda principalmente la generaci on dinamica de hechos para el calculo a demanda de indicadores de redes sociales. El sistema planteado en el proyecto descansa en el modelo conceptual de SLOD-BI, y plantea nuevos desafos de investigacion tales como la generacion dinamica de conocimiento y el mantenimiento de su coherencia.
  • Artículo
    A First Approach towards Storage and Query Processing of Big Spatial Networks in Scalable and Distributed Systems
    Mena, Manel; Corral, Antonio; Iribarne, Luis. Actas de las XXIII Jornadas de Ingeniería del Software y Bases de Datos (JISBD 2018), 2018-09-17.
    Due to the ubiquitous use of spatial data applications and the large amounts of spatial data that these applications generate, the processing of large-scale queries in distributed systems is becoming increasingly popular. Complex spatial systems are very often organized under the form of Spatial Networks, a type of graph where nodes and edges are embedded in space. Examples of these spatial networks are transportation and mobility networks, mobile phone networks, social and contact networks, etc. When these spatial networks are big enough that exceed the capacity of commonly-used spatial computing technologies, we have Big Spatial Networks, and to manage them is necessary the use of distributed graph-parallel systems. In this paper, we describe our emerging work concerning the design of new storage methods and query processing algorithms over big spatial networks in scalable and distributed systems, which is a very active research area in the past years.
  • Artículo
    Un Repositorio RDF para la Integración y Consulta de Datos de Pacientes Hepáticos
    Roldán-García, María del Mar; Aldana-Montes, José F.. Actas de las XXIII Jornadas de Ingeniería del Software y Bases de Datos (JISBD 2018), 2018-09-17.
    Los casos médicos pasados, y por lo tanto, la experiencia clínica, son recursos de valor incalculable para apoyar la práctica clínica, la investigación y la formación. Los profesionales médicos deben poder intercambiar información sobre casos médicos de pacientes y explorarlos desde distintas perspectivas subjetivas. Esto requiere de una metodología sistemática y flexible para la representación de los casos médicos que soporte el intercambio de información procesable del paciente. En este artículo presentamos un enfoque basado en ontologías para modelar casos médicos de pacientes que utiliza pacientes con enfermedades hepáticas como ejemplo. Para este fin, se propone una nueva ontología, LiCO, que utiliza estándares médicos bien conocidos para representar casos de pacientes con enfermedades hepáticas. La utilidad del enfoque propuesto se demuestra con consultas semánticas y razonamiento utilizando datos recopilados de pacientes reales. Los resultados preliminares son prometedores con respecto al potencial de la representación de casos médicos basada en ontologías para la construcción de sistemas de búsqueda y recuperación de información de casos médicos, allanando el camino hacia una plataforma de intercambio de experiencias clínicas para comparar diagnósticos, para investigación y para formación.
  • Artículo
    Enriquecimiento Automático de Ontologías Biomédicas mediante el uso de Mappings
    García Godoy, María Jesús; López-Camacho, Esteban; Roldán-García, María del Mar; Aldana-Montes, José F.. Actas de las XXIII Jornadas de Ingeniería del Software y Bases de Datos (JISBD 2018), 2018-09-17.
    Dione es una representación en OWL del ICD-10-CM, consistente lógicamente, cuyos axiomas definen las inclusiones y exclusiones del ICD-10-CM mediante una metodología basada en los mappings ICD-10-CM/SNOMED-CT, proporcionados por UMLS y BioPortal, y que han sido validados por una comunidad de expertos en el ámbito biomédico. En este artículo se presenta una metodología automática que permite la población con axiomas en Dione a partir de los mappings establecidos entre ICD-10-CM y otra ontología biomédica que hayan sido proporcionados por BioPortal. Para mostrar el funcionamiento de esta metodología, se han utilizado los mappings entre Dione y ORDO. Esta última es una ontología que incluye el conjunto de enfermedades raras, genes y otras características para la población de nuevos axiomas en Dione. Una vez que estos axiomas se incluyeron en Dione, se comprobó su consistencia utilizando el razonador ELK y se mostró con un caso de uso que las clases equivalentes entre las ontologías DIONE-ORDO permitían la inferencia de axiomas que definen una clase ICD-10-CM en DIONE a una clase que representa una enfermedad rara en ORDO y, viceversa. Esta nueva metodología se puede aplicar a dos ontologías biomédicas cualquiera cuyos mappings estén previamente definidos en BioPortal.
  • Artículo
    Consulta eficiente de datos moleculares: Situación actual y retos futuros
    Luaces Cachaza, David; Goebel, Michael; Ríos Viqueira, José Ramón; García, José Antonio; Pena, Tomás F.; Cobas, Carlos. Actas de las XXIII Jornadas de Ingeniería del Software y Bases de Datos (JISBD 2018), 2018-09-17.
    En los últimos años, sectores industriales como el químico o el farmacéutico vienen demandando la gestión eficiente de datos analíticos tales como espectros NMR, o estructuras moleculares. En la actualidad existen varias bibliotecas quimioinformáticas que pueden ser incorporadas dentro de los SGBDs relacionales. Sin embargo, estas soluciones no son eficaces para todos los tipos de consultas necesarias (datos espectroscópicos y cromatográficos por ejemplo) y no son eficientes para trabajar con el volumen de datos requerido en la actualidad. En este artículo se describe el problema de la búsqueda de datos moleculares y se proporciona una breve introducción a las soluciones iniciales y retos futuros en este campo dentro del marco del proyecto NEXTCHROM.
  • Artículo
    Generación de datos NoSQL usando esquemas de bases de datos inferidos
    Hernández Chillón, Alberto; Sevilla Ruiz, Diego; García Molina, Jesús Joaquín. Actas de las XXIII Jornadas de Ingeniería del Software y Bases de Datos (JISBD 2018), 2018-09-17.
    La generación automática de datos resulta muy adecuada para realizar pruebas sobre bases de datos. Para sistemas relacionales se han definido diferentes enfoques y existe un buen número de herramientas. Sin embargo, todavía se ha prestado escasa atención a este problema para sistemas NoSQL. En este trabajo se presenta un primer prototipo de una herramienta desarrollada para generar datos NoSQL a partir de esquemas inferidos y representados como modelos conformes al metamodelo NoSQLSchema. Se describe el proceso de generación y la validación realizados, y se comenta el trabajo futuro.