Reconocimiento temporal para el italiano combinando técnicas de aprendizaje automático y adquisición automática de conocimiento

  1. Saquete Boró, Estela
  2. Ferrández Escámez, Óscar
  3. Martínez Barco, Patricio
  4. Muñoz Guillena, Rafael
Journal:
Procesamiento del lenguaje natural

ISSN: 1135-5948

Year of publication: 2006

Issue: 37

Pages: 161-168

Type: Article

More publications in: Procesamiento del lenguaje natural

Repositorio Institucional de la Universidad de Alicante: lock_openOpen access Handle

Sustainable development goals

Abstract

Este artículo presenta la extensión automática del sistema TERSEO a otras lenguas combinada con el uso de técnicas basadas en Aprendizaje Automático (AA). En concreto, en este artículo se trabaja en el reconocimiento de expresiones temporales para el italiano y se han probado dos técnicas diferentes de AA: un modelo de Máxima Entropía y modelos ocultos de Markov. Cada sistema ha sido evaluado tanto de manera independiente como de manera combinada con la finalidad de analizar si el sistema combinado mejora los resultados de los sistemas independientes sin incrementar el número de expresiones erróneas en el mismo porcentaje. El sistema TERSEO fue combinado previamente con técnicas de AA para el inglés, obteniendo en ese caso buenos resultados. En este artículo, la combinación del reconocimiento de TERSEO con el reconocimiento del sistema de AA ha sido evaluada para el italiano. La combinación de TERSEO con diferentes técnicas de AA ha sido evaluada obteniendo resultados satisfactorios, sobre todo, teniendo en cuenta que la extensión automática de TERSEO al italiano no ha sido supervisada manualmente y el proceso se ha realizado de manera completamente automática.

Bibliographic References

  • Carmona, J., S. Cervell, L. Márquez, M.A. Martí, L. Padró, R. Placer, H. Rodríguez, M. Taulé, y J. Turmó. 1998. Morphosyntactic analysis and parsing of unrestricted spanish text. En LREC, editor, Proceedings of First International Conference on Language Resources and Evaluation, LREC 1998, Granada, Spain.
  • Ferro, L., L. Gerber, I. Mani, B. Sundheim, y G. Wilson. 2005. Tides.2005 standard for the annotation of temporal expressions. Informe técnico, MITRE.
  • Ratnaparkhi, Adwait. 1998. Maximum Entropy Models For Natural Language Ambiguity Resolution. Ph.D. tesis, Computer and Information Science Department, University of Pennsylvania.
  • Saquete, E. 2005. Temporal information Resolution and its application to Temporal Question Answering. Phd, Departamento de Lenguages y Sistemas Informáticos. Universidad de Alicante, June.
  • Saquete, E., P. Martínez-Barco, y R. Muñoz. 2004. Evaluation of the automatic multilinguality for time expression resolution. En DEXA Workshops, páginas 25– 30. IEEE Computer Society.
  • Saquete, E., P. Martínez-Barco, y R. Muñoz. 2002. A grammar-based system to solve temporal expressions in spanish texts. En Springer-Verlag, editor, Proceedings of the Portugal for Natural Language Processing PorTAL-2002, Lecture Notes in Artificial Intelligence, páginas 53–62, Faro, Portugal.
  • Saquete, E., R. Muñoz, y P. Martínez-Barco. 2005. Event ordering using terseo system. Data and Knowledge Engineering Journal, página (To be published).
  • Schröder, Ingo. 2002. A case study in partof-speech tagging using the icopost toolkit. Informe Técnico FBI-HH-M-314/02, Department of Computer Science, University of Hamburg.