Debido al alto tráfico generado por robots, estamos aplicando limitaciones en el número de peticiones permitidas por cliente y bloqueos por IP automáticos. Si haces un uso legítimo y estás teniendo problemas, avísanos para reevaluar nuestras políticas de bloqueo. Disculpa las molestias.

Artículo:
Extracción de Comentarios y Metadatos en Secciones de Reseñas de Productos

Cargando...
Miniatura

Editor

Sistedes

Publicado en

Actas de las XXIV Jornadas de Programación y Lenguajes (PROLE 2025)

Licencia Creative Commons

Resumen

Las secciones de reseñas y comentarios en sitios de comercio electrónico representan una fuente muy valiosa de información sobre la experiencia del usuario con un producto. Sin embargo, son escasas las herramientas que permiten, de forma automática, localizar la sección de comentarios, diferenciar los comentarios reales de otro contenido irrelevante y extraer metadatos clave de interés (puntuación, fecha, reseña y nombre de usuario). La mayoría de herramientas enfocadas a estas tareas necesitan tener conocimiento previo sobre la página o recurrir a plantillas predefinidas del sitio web. Este trabajo presenta una nueva técnica que resuelve estas limitaciones. La propuesta se basa en el análisis del árbol DOM de la página web. Concretamente, el análisis de diferentes propiedades DOM permite detectar y descartar aquellos nodos que no corresponden a comentarios para, posteriormente, aislar cada comentario extrayendo su puntuación, fecha, reseña y nombre de usuario. Este documento ofrece una visión general de la metodología y estrategia empleada.

Descripción

Acerca de Alarte, Julián

Palabras clave

Scraping, Record-level, Valoraciones De Productos, Tiendas En Línea, Extracción De Metadatos

Citación

Alarte, J., Galindo, C., Martín-Abellán, C., Silva, J.: Extracción de Comentarios y Metadatos en Secciones de Reseñas de Productos. In: Pino, E. (ed.) Actas de las XXIV Jornadas de Programación y Lenguajes (PROLE 2025). Sistedes (2025). https://hdl.handle.net/11705/PROLE/2025/14