Selección de características para la clasificación de preguntas multilingüe

  1. Tomás Díaz, David
  2. Vicedo González, José-Luis
Aldizkaria:
Procesamiento del lenguaje natural

ISSN: 1135-5948

Argitalpen urtea: 2010

Zenbakia: 44

Orrialdeak: 67-74

Mota: Artikulua

Beste argitalpen batzuk: Procesamiento del lenguaje natural

Laburpena

Este trabajo presenta un estudio sobre el rendimiento de diferentes métodos de selección de características aplicados a la tarea de clasificación de preguntas en diferentes idiomas. El estudio se ha realizado sobre un corpus paralelo de preguntas en cuatro idiomas: inglés, español, italiano y catalán.

Erreferentzia bibliografikoak

  • Bisbal, Empar, David Tomás, Lidia Moreno, José L. Vicedo, y Armando Suárez. 2005. A multilingual svm-based question classification system. En MICAI 2005, volumen 3789 de LNCS, p´aginas 806–815. Springer.
  • Cardie, Claire. 1996. Automatic feature set selection for case-based learning of linguistic knowledge. En Conference on Empirical Methods in Natural Language Processing, páginas 113–126.
  • Forman, George. 2003. An extensive empirical study of feature selection metrics for text classification. The Journal of Machine Learning Research, 3:1289–1305.
  • Li, Xin y Dan Roth. 2002. Learning question classifiers. En Proceedings of the 19th international conference on Computational linguistics, páginas 1–7, Morristown, NJ, EEUU. Association for Computational Linguistics.
  • Sekine, Satoshi, Kiyoshi Sudo, y Chikashi Nobata. 2002. Extended named entity hierarchy. En LREC 2002, páginas 1818–1824, Las Palmas, España.
  • Wang, Xizhao y Qiang He. 2004. Enhancing generalization capability of svm classifiers with feature weight adjustment. En KES 2004, volumen 3213 de Lecture Notes in Computer Science, p´aginas 1037–1043. Springer.
  • Witten, Ian H. y Eibe Frank. 2005. Data Mining: Practical Machine Learning Tools and Techniques. Morgan Kaufmann, San Francisco, 2 edición.
  • Yang, Yiming y Jan O. Pedersen. 1997. A comparative study on feature selection in text categorization. En ICML ’97, p´aginas 412–420, San Francisco, CA, EEUU. Morgan Kaufmann Publishers Inc.
  • Zhang, Dell y Wee Sun Lee. 2003. Question classification using support vector machines. En SIGIR ’03, páginas 26–32, Nueva York, NY, EEUU. ACM.