Autor: Luaces Cachaza, David
Proyectos de investigación
Unidades organizativas
Puesto de trabajo
Apellidos
Luaces Cachaza
Nombre de pila
David
Nombre
Nombres alternativos
Afiliaciones conocidas
COGRADE - CiTIUS - Universidade de Santiago de Compostela, Spain
Páginas web conocidas
Página completa del ítem
Notificar un error en este autor
3 resultados
Resultados de la búsqueda
Mostrando 1 - 3 de 3
Artículo Hacia el descubrimiento de datos geoespaciales y medioambientales basado en palabras claveRey, Andrea; Viqueira, José R.R.; Martinez Casas, David; Luaces Cachaza, David. Actas de las XXVII Jornadas de Ingeniería del Software y Bases de Datos (JISBD 2023), 2023-09-12.En este artículo se introduce la motivación y los objetivos de una línea de investigación sobre descubrimiento de datos espacio-temporales basado en palabras clave, que se está iniciando en el grupo de investigación COGRADE de la Universidade de Santiago de Compostela. Los retos principales tienen que ver con la mejora de los métodos actuales de acceso para poder utilizarse durante el filtrado basado en palabras clave sobre propiedades no textuales y con conjuntos de gran volumen.Artículo Consulta eficiente de datos moleculares: Situación actual y retos futurosLuaces Cachaza, David; Goebel, Michael; Viqueira, José R.R.; García, José Antonio; Pena, Tomás F.; Cobas, Carlos. Actas de las XXIII Jornadas de Ingeniería del Software y Bases de Datos (JISBD 2018), 2018-09-17.En los últimos años, sectores industriales como el químico o el farmacéutico vienen demandando la gestión eficiente de datos analíticos tales como espectros NMR, o estructuras moleculares. En la actualidad existen varias bibliotecas quimioinformáticas que pueden ser incorporadas dentro de los SGBDs relacionales. Sin embargo, estas soluciones no son eficaces para todos los tipos de consultas necesarias (datos espectroscópicos y cromatográficos por ejemplo) y no son eficientes para trabajar con el volumen de datos requerido en la actualidad. En este artículo se describe el problema de la búsqueda de datos moleculares y se proporciona una breve introducción a las soluciones iniciales y retos futuros en este campo dentro del marco del proyecto NEXTCHROM.Artículo Procesamiento aproximado para la búsqueda interactiva en conjuntos de datos molecularesLuaces Cachaza, David; Viqueira, José R.R.; Martinez Casas, David; Rey, Andrea; Vázquez Álvarez, Álvaro. Actas de las XXVIII Jornadas de Ingeniería del Software y Bases de Datos (JISBD 2024), 2024-06-17.Muchas son las situaciones en las que usuarios de bases de datos de compuestos químicos pueden necesitar efectuar búsquedas de moléculas cuya estructura molecular pueda contener a una determinada subestructura. Un ejemplo es la eliminación de réplicas de compuestos conocidos. Una estructura molecular se representa mediante un grafo, cuyos nodos son átomos de elementos químicos (carbón, nitrógeno, hidrógeno, etc.), y cuyos arcos son enlaces químicos entre átomos. La búsqueda de subestructuras, se transforma así en un problema bien conocido en la computación, es decir, en la búsqueda de subgrafos. En una interfaz interactiva de filtrado, la base de datos se filtra automáticamente e interactivamente según el usuario va especificando su consulta. Un ejemplo bien conocido es el filtrado basado en palabras clave utilizado en búsquedas de texto completo. En este caso, según el usuario va tecleando las letras de su consulta el resultado de la búsqueda se va actualizando interactivamente. En este tipo de interfaces, la precisión de la respuesta es secundaria respecto al tiempo de respuesta del sistema, que debe de ser interactivo (por debajo del segundo). Para la búsqueda interactiva de estructuras moleculares, se pueden construir interfaces similares, en las que el usuario va construyendo gráficamente su estructura mientras el resultado de la consulta se va actualizando de forma interactiva. Las soluciones actuales de búsqueda de subgrafos combinan el uso de un índice con un algoritmo de isomorfismo de grafos, que elimina falsos positivos obtenidos del índice. Estas soluciones proporcionan soluciones totalmente precisas en tiempo interactivos cuando las bases de datos son razonablemente pequeñas (alrededor del millón de grafos). Sin embargo, cuando las bases de datos superan las decenas de millones de grafos, los tiempo de respuesta se disparan, incluso si se utilizan implementaciones avanzadas sobre arquitecturas paralelas. Estos tiempos de respuesta altos se dan al tener que aplicar el algoritmo de isomorfismo de grafos (que es muy lento) sobre resultados grandes obtenidos del índice, bien porque la consulta es poco selectiva o porque la base de datos es muy grande. En este trabajo se probarán distintas estructuras de representación aproximada de conjuntos de datos para implementar la búsqueda aproximada de subestructuras que ofrezcan siempre tiempos de respuesta interactivos (por debajo del segundo). El objetivo general será encontrar aquellas configuraciones de estructuras y parámetros que ofrezcan un mejor compromiso entre el tiempo de respuesta y la eficacia de la búsqueda (precisión y completitud), siempre primando la respuesta interactiva.