A semantic approach to temporal information processing

  1. Llorens Martínez, Héctor
Dirigida por:
  1. Estela Saquete Boró Directora
  2. Borja Navarro Colorado Director

Universidad de defensa: Universitat d'Alacant / Universidad de Alicante

Fecha de defensa: 11 de julio de 2011

Tribunal:
  1. Patricio Martínez Barco Presidente
  2. Paloma Moreda Pozo Secretaria
  3. Horacio Rodríguez Hontoria Vocal
  4. Tommaso Caselli Vocal
  5. Roser Saurí Vocal
Departamento:
  1. LENGUAJES Y SISTEMAS INFORMATICOS

Tipo: Tesis

Teseo: 311186 DIALNET lock_openRUA editor

Resumen

Esta tesis se centra en el procesamiento de la información temporal, que es una tarea enmarcada en el campo del procesamiento del lenguaje natural. El objetivo de esta tarea es obtener la representación y ordenación temporal de los eventos expresados en el texto o discurso, lo cual requiere la interpretación automática de las expresiones temporales, los eventos, y sus relaciones temporales. La mayoría de las aproximaciones actuales están basadas en información morfosintáctica. Sin embargo, las entidades temporales son, a menudo, ambiguas a ese nivel de análisis lingüístico. Nuestra hipótesis es que la expresión lingüística del tiempo es un fenómeno semántico y por lo tanto, para obtener un mejor rendimiento, la información temporal debe ser procesada usando también información semántica. Para probar esta hipótesis, presentamos una aproximación semántica al procesamiento de la información temporal: TIPSem. Se trata de un sistema automático que incluye características basadas en semántica léxica, roles semánticos, y semántica temporal, además de en morfosintaxis. TIPSem ha sido evaluado a través de la participación en el ejercicio internacional de evaluación TempEval-2. Los resultados obtenidos avalan la hipótesis presentada y el análisis de los mismos demuestra que las características semánticas favorecen las capacidades de generalización del modelo y ayudan a manejar la ambigüedad morfosintáctica. Estas colusiones se han alcanzado para diferentes lenguas (i.e., inglés, castellano, italiano, y chino), lo que avala la hipótesis a nivel multilingüe. Finalmente, en comparación con el estado de la cuestión, TIPSem ofrece un rendimiento muy competitivo e introduce una mejora notable en el procesamiento de eventos. Además, TIPSem ha sido aplicado al problema de la representación gráfica de la información temporal. Se ha desarrollado una interfaz dinámica que ofrece a los usuarios un acceso a la información basado en el tiempo: Time-Surfer. Los resultados obtenidos mediante una evaluación orientada al usuario de esta interfaz demuestran que el rendimiento de TIPSem es también satisfactorio desde un punto de vista extrínseco.