Detección de menciones anidadas basada en expansión para el español

  1. Puchol Blasco, Marcel
  2. Martínez Barco, Patricio
Revista:
Procesamiento del lenguaje natural

ISSN: 1135-5948

Año de publicación: 2011

Número: 47

Páginas: 215-221

Tipo: Artículo

Otras publicaciones en: Procesamiento del lenguaje natural

Resumen

La detección de menciones es el primer módulo utilizado en los sistemas de resolución de la correferencia. Debido a que los errores se van acarreando de un módulo a otro, es importante que los resultados obtenidos por este módulo sean los mejores posibles. Dentro del campo de la detección de menciones, las menciones anidadas son las más difíciles de detectar. En este artículo presentamos un sistema de detección de menciones anidadas basado en expansión, un nuevo modelo de detección de elementos de Procesamiento de Lenguaje Natural anidados basado en aprendizaje automático. Los resultados obtenidos por nuestro sistema son superiores al 72 % de medida-F en el corpus AnCora. No podemos comparar directamente nuestros resultados con otros sistemas debido a que no existen como tales, pero si comparamos la medida-F media obtenida por otros sistemas en la detección de todo tipo de menciones (no solo menciones anidadas), y que nosotros estamos tratando con las menciones más difíciles, conseguimos resultados favorables.

Referencias bibliográficas

  • Abney, Steven. 1996. Partial parsing via finite-state cascades. Natural Language Engineering, 2(4):337–344.
  • Byrne, Kate. 2007. Nested named entity recognition in historical archive text. International Conference on Semantic Computing, 0:589–596.
  • Cardie, Claire. 1997. Empirical methods in information extraction. AI magazine, 18:65–79.
  • Finkel, Jenny Rose y Christopher D. Manning. 2009. Nested named entity recognition. En Proceedings of the 2009 Conference on Empirical Methods in Natural Language Processing: Volume 1 - Volume 1, EMNLP ’09, páginas 141–150, Stroudsburg, PA, USA. Association for Computational Linguistics.
  • González, José Luis Vicedo y Antonio Ferrández Rodríguez. 2000. Applying anaphora resolution to question answering and information retrieval systems. En Proceedings of the First International Conference on Web-Age Information Management, WAIM ’00, páginas 344–355, London, UK. Springer-Verlag.
  • Hacioglu, Kadri, Benjamin Douglas, y Ying Chen. 2005. Detection of entity mentions occurring in english and chinese text. En Proceedings of the conference on Human Language Technology and Empirical Methods in Natural Language Processing, HLT ’05, páginas 379–386, Stroudsburg, PA, USA. Association for Computational Linguistics.
  • Jakob, Niklas y Iryna Gurevych. 2010. Using anaphora resolution to improve opinion target identification in movie reviews. En Proceedings of the ACL 2010 Conference Short Papers, ACLShort ’10, páginas 263–268, Stroudsburg, PA, USA. Association for Computational Linguistics.
  • Lappin, Shalom y Herbert J. Leass. 1994. An algorithm for pronominal anaphora resolution. Computational Linguistics, 20(4):535–561.
  • Morton, Thomas S. 1999. Using coreference in question answering. En In Proceedings of the 8th Text REtrieval Conference (TREC-8, páginas 85–89.
  • Ng, Vincent. 2004. Learning noun phrase anaphoricity to improve coreference resolution: issues in representation and optimization. En Proceedings of the 42nd Annual Meeting on Association for Computational Linguistics, ACL ’04, Stroudsburg, PA, USA. Association for Computational Linguistics.
  • Pradhan, Sameer S., Wayne Ward, y James H. Martin. 2008. Towards robust semantic role labeling. Comput. Linguist., 34:289–310, June.
  • Recasens, Marta, Lluís Màrquez, Emili Sapena, M. Antònia Martí, Mariona Taulé, Véronique Hoste, Massimo Poesio, y Yannick Versley. 2010. Semeval-2010 task 1: Coreference resolution in multiple languages. En Proceedings of the 5th International Workshop on Semantic Evaluation, SemEval ’10, páginas 1–8, Stroudsburg, PA, USA. Association for Computational Linguistics.
  • Recasens, Marta y M. Antònia Martí. 2010. Ancora-co: Coreferentially annotated corpora for spanish and catalan. Lang. Resour. Eval., 44:315–345, December.
  • Soon, Wee Meng, Hwee Tou Ng, y Daniel Chung Yong Lim. 2001. A machine learning approach to coreference resolution of noun phrases. Computational Linguistics, 27(4):521–544.
  • Steinberger, Josef, Massimo Poesio, Mijail A. Kabadjov, y Karel Jeek. 2007. Two uses of anaphora resolution in summarization. Inf. Process. Manage., 43:1663–1680, November.
  • Stoyanov, Veselin, Claire Cardie, Nathan Gilbert, Ellen Riloff, David Buttler, y David Hysom. 2010. Coreference resolution with reconcile. En Proceedings of the ACL 2010 Conference Short Papers, ACLShort ’10, páginas 156–161, Stroudsburg, PA, USA. Association for Computational Linguistics.