Navegación

Búsqueda

Búsqueda avanzada

Verificación de la información extraída por wrappers web usando algoritmos basados en colonias de hormigas

Resumen:

Un wrapper es un sistema automático que permite navegar, extraer, estructurar y verificar información proveniente de la Web. Una de las tareas más importantes dentro de este campo es la verificación automática de la información proveniente de esta fuente de datos semiestructurados. En la literatura existen distintas técnicas que intentan solucionar este problema. En este trabajo, presentamos una nueva propuesta que hace uso de los algoritmos de optimización basados en colonias de hormigas. De los distintos algoritmos de colonias de hormigas existentes, usaremos el denominado Best-Worst Ant System que ya ha sido usado en diversos problemas de optimización alcanzando unos resultados bastante prometedores. Realizaremos un análisis no paramétrico del comportamiento de nuestra propuesta y la compararemos con las técnicas de verificación ya existentes. Para hacer este estudio utilizaremos diversas bases de datos reales. Los resultados obtenidos nos permiten confirmar el buen rendimiento que presenta nuestra propuesta frente a los métodos tradicionales aplicados.

Palabras Clave:

Autor(es):

Handle:

11705/JISBD/2012/022

Descargas:

Este artículo tiene una licencia de uso CreativeCommons - Reconocimiento (by)

Descarga el artículo haciendo click aquí.