Recuperacion de informacion multimodal basado en integracion del conocimiento

  1. Díaz Galiano, Manuel Carlos
Supervised by:
  1. Luis Alfonso Ureña López Director
  2. María Teresa Martín Valdivia Director

Defence university: Universidad de Jaén

Fecha de defensa: 14 April 2011

Committee:
  1. Manuel Palomar Sanz Chair
  2. Arturo Montejo Ráez Secretary
  3. Paloma Martínez Fernández Committee member
  4. Emilio Sanchís Arnal Committee member
  5. Ana M. García Serrano Committee member

Type: Thesis

Teseo: 311112 DIALNET

Abstract

Este trabajo pretende integrar conocimiento y técnicas de filtrado de la información para mejorar los sistemas de Recuperación de Información Multimodal. Los sistemas de Recuperación de Información (IR) tradicionales se ocupan básicamente de tratar con información textual. No obstante, la cantidad de información electrónica existente hoy en día no es solo textual, sino más bien, multimodal. Dentro de la multimodalidad nos referimos a cualquier formato que incluya información textual, imágenes, video o audio, y en la mayoría de los casos se suele encontrar mezclada. Existen sistemas especializados en la extracción de información en formatos distintos al texto. De esta forma podemos encontrar sistemas de Recuperación de Imágenes Basados en el Contenido, sistemas extraen características de videos o sistemas que transcriben conversaciones a texto. En la mayoría de ellos la información obtenida termina expresándose de forma textual, por lo que, al final se suelen utilizar técnicas tradicionales en el tratamiento de texto. Un sistema multimodal es aquel que recupera información de grandes colecciones en formatos distintos. De esta forma se pueden explotar las bondades de distintos sistemas especializados: esta multimodalidad permite, por ejemplo, que sistemas CBIR puedan ser mejorados utilizando información textual que aparece junto a las imágenes. Estos sistemas son útiles también para distintos tipos de profesionales que necesitan trabajar con otros formatos distintos al texto. Dentro de este ámbito podemos considerar el trabajo médico, el cual genera grandes volúmenes de información sobre cada caso clínico, incluyendo texto e imágenes de las distintas pruebas realizadas. El trabajo consiste en estudiar cómo se ve afectado un sistema multimodal, al filtrar e incluir conocimiento específico a la información textual disponible. Para ello se utilizan los corpus multimodales que ponen a nuestra disposición distintos foros de evaluación de estos sistemas. Nos centraremos en los corpus ofrecidos por ImageCLEFmed, ya que tratan un entorno más específico comoe s el entorno médico.