Utilización de pasajes de tamaño variable para mejorar el proceso de recuperación de información

  1. Ferrández Rodríguez, Antonio
  2. Vicedo González, José-Luis
  3. Llopis Pascual, Fernando
Revista:
Procesamiento del lenguaje natural

ISSN: 1135-5948

Año de publicación: 2002

Número: 28

Páginas: 89-98

Tipo: Artículo

Otras publicaciones en: Procesamiento del lenguaje natural

Resumen

Trabajos previos demuestran que la utilización de fragmentos de documentos como unidad básica de información, para calcular la relevancia de un documento con respecto a una pregunta, mejora sensiblemente los resultados de los sistemas de recuperación de información. Sin embargo, no se ha llegado a un consenso acerca de cómo definir esos fragmentos de texto (o párrafos) de forma que el sistema alcance un comportamiento óptimo. El presente artículo presenta un sistema de recuperación de información, basado en la definición de pasajes de tamaño variable. Cada pasaje está formado por un número determinado de las frases que forman el documento. El número de frases seleccionadas para cada pasaje dependerá de la localización de las palabras de la pregunta en cada documento. La evaluación realizada permite comparar el rendimiento de este modelo con un sistema estándar de recuperación de documentos, así como con otras propuestas que utilizan diferentes métodos de definición de pasajes.