Artículo: Extracción de Comentarios y Metadatos en Secciones de Reseñas de Productos
Archivos
Fecha
Editor
Publicado en
Licencia Creative Commons
Resumen
Las secciones de reseñas y comentarios en sitios de comercio electrónico representan una fuente muy valiosa de información sobre la experiencia del usuario con un producto. Sin embargo, son escasas las herramientas que permiten, de forma automática, localizar la sección de comentarios, diferenciar los comentarios reales de otro contenido irrelevante y extraer metadatos clave de interés (puntuación, fecha, reseña y nombre de usuario). La mayoría de herramientas enfocadas a estas tareas necesitan tener conocimiento previo sobre la página o recurrir a plantillas predefinidas del sitio web. Este trabajo presenta una nueva técnica que resuelve estas limitaciones. La propuesta se basa en el análisis del árbol DOM de la página web. Concretamente, el análisis de diferentes propiedades DOM permite detectar y descartar aquellos nodos que no corresponden a comentarios para, posteriormente, aislar cada comentario extrayendo su puntuación, fecha, reseña y nombre de usuario. Este documento ofrece una visión general de la metodología y estrategia empleada.


