Detección de expresiones temporales TimeML en Catalán mediante roles semánticos y redes semánticas

  1. Llorens Martínez, Héctor
  2. Navarro Colorado, Borja
  3. Saquete Boró, Estela
Revista:
Procesamiento del lenguaje natural

ISSN: 1135-5948

Año de publicación: 2009

Número: 43

Páginas: 13-21

Tipo: Artículo

Otras publicaciones en: Procesamiento del lenguaje natural

Resumen

Actualmente, la representación y procesamiento computacional de la información temporal en las lenguas naturales está siendo objeto de gran interés para la comunidad científica. El principal esquema de anotación para representar la información temporal es el TimeML, que ha sido tomado como estándar por un gran número de investigadores. Sin embargo, los recursos disponibles son muy limitados, sobre todo para lenguas diferentes del inglés. En este trabajo analizamos el uso de redes semánticas y roles semánticos desde una perspectiva multilingüe para la detección automática de expresiones temporales siguiendo el estándar TimeML. La propuesta ha sido evaluada para el catalán obteniendo un Fβ=1 estricto de 83.7 %, y comparada con sus resultados para el inglés y el español confirmando que puede ser aplicada con éxito a diferentes idiomas.

Referencias bibliográficas

  • Allen, James F. 1983. Maintaining knowledge about temporal intervals. Communications of ACM, 26(11):832–843.
  • Benitez, Laura, Sergi Cervell, Gerard Escudero, Mónica López, German Rigau, y Mariona Taule. 1998. Methods and Tools for Building the Catalan WordNet. En ERLA Workshop on Language Resources for European Minority Languages, LREC.
  • Boguraev, Branimir y Rie Kubota Ando.2007. Effective Use of TimeBank for TimeML Analysis. En Annotating, Extracting and Reasoning about Time and Events, páginas 41–58. Springer.
  • Fellbaum, Christiane. 1998. WordNet: An Electronic Lexical Database (Language, Speech, and Communication). MIT.
  • Ferro, Lisa, Laurie Gerber, Inderjeet Mani, Beth Sundheim, y George Wilson. 2005. TIDES Standard for the Annotation of Temp. Expr. Informe tecnico, MITRE.
  • Gildea, Daniel y Daniel Jurafsky. 2002. Automatic labeling of semantic roles. Computational Linguistics, 28(3).
  • Hagege, Caroline y Xavier Tannier. 2007. XRCE-T: XIP temporal module for TempEval campaign. En TempEval (SemEval), paginas 492–495. ACL.
  • Llorens, Hector, Borja Navarro, y Estela Saquete. 2009. Using Semantic Networks to Identify Temporal Expressions from Semantic Roles. En RANLP (Accepted).
  • Martı, M. Antonia, Mariona Taule, Lluís Márquez, y Manuel Bertran. 2007. Anotación semiautomatica con papeles temáticos de los corpus CESS-ECE. En Procesamiento del Lenguaje Natural, volumen 38.
  • Moia, Telmo. 2001. Telling apart temporal locating adverbials and time-denoting expressions. En Proceedings of the workshop on Temporal and Spatial information processing, paginas 1–8, NJ, USA. ACL.
  • Negri, M. y L. Marseglia. 2004. Recognition and Normalization of Time Expressions: ITC-irst at TERN 2004. Informe tecnico, Information Society Technologies.
  • Pustejovsky, James. 2002. TERQAS: Time and Event Recognition for Question Answering Systems. En ARDA Workshop.
  • Pustejovsky, James, Jose M. Castano, Robert Ingria, Roser Saurı, Robert J. Gaizauskas, Andrea Setzer, y Graham Katz. 2003a. TimeML: Robust Specification of Event and Temporal Expressions in Text. En IWCS-5.
  • Pustejovsky, James, Patrik Hanks, Roser Saurı, Anderw See, Robert J. Gaizauskas, Andrea Setzer, Dragomir R. Radev, Beth Sundheim, David Day, Lisa Ferro, y Marcia Lazo. 2003b. The TIMEBANK Corpus. En Corpus Linguistics.
  • Saquete, Estela, Patricio Martínez-Barco, y Rafael Munoz. 2004. Automatic Multilinguality for Time Expression Resolution. En MICAI, volumen 2972 de LNCS.
  • Schilder, Frank, Graham Katz, y James Pustejovsky. 2007. Annotating, Extracting and Reasoning About Time and Events, volumen 4795 de LNCS. Springer.
  • Setzer, Andrea y Robert Gaizauskas. 2000. Annotating Events and Temporal Information in Newswire Texts. En LREC 2000, paginas 1287–1294, Athens.
  • Taule, Mariona, M. Antonia Martı, y Marta Recasens. 2008. AnCora: Multilevel Annotated Corpora for Catalan and Spanish. En ELRA, editor, LREC.
  • TERN. 2004. Time Expression Recognition and Normalization Evaluation Workshop (http://fofoca.mitre.org/tern.html).
  • Verhagen, Marc, Robert J. Gaizauskas, Mark Hepple, Frank Schilder, Graham Katz, y James Pustejovsky. 2007. Semeval-2007 task 15: Tempeval temporal relation identification. En Proceedings of the 4th International Workshop on Semantic Evaluations, paginas 75–80, Prague. ACL.
  • Verhagen, Marc, Inderjeet Mani, Roser Saurı, Robert Knippen, Seok Bae Jang, Jessica Littman, Anna Rumshisky, John Phillips, y James Pustejovsky. 2005. Automating temporal annotation with TARSQI. En ACL, paginas 81–84, NJ, USA. ACL.
  • Wilson, George, Inderjeet Mani, Beth Sundheim, y Lisa Ferro. 2001. A multilingual approach to annotating and extracting temporal information. En Workshop on Temporal and Spatial information processing. ACL