Filtrado de información para la búsqueda de respuestas

  1. Noguera Robles, Elisa
  2. Llopis Pascual, Fernando
  3. Ferrández Rodríguez, Antonio
Revista:
Procesamiento del lenguaje natural

ISSN: 1135-5948

Año de publicación: 2006

Número: 37

Páginas: 145-152

Tipo: Artículo

Otras publicaciones en: Procesamiento del lenguaje natural

Resumen

La complejidad de los sistemas de Búsqueda de Respuestas (BR) dificulta que sean aplicados a grandes colecciones de documentos. Por este mótivo, los sistemas de BR utilizan como paso previo un sistema de Recuperación de Información (RI), para detectar los documentos relevantes y disminuir de esta forma la información a procesar. En este artículo, presentamos un método para filtrar los documentos no relevantes en el contexto de BR. Concretamente, el método aplicado para filtrar información está basado en el teorema del valor medio. Hemos evaluado este método con tres medidas de similitud distintas: la medida del coseno, okapi y dfr. En los experimentos obtenemos una reducción de hasta el 89% de información sin apenas pérdida significativa en la precisión. Además, mediante este método, mejoramos un 7.05% la precisión global de un sistema de BR.