Selección de características para la clasificación de preguntas multilingüe
ISSN: 1135-5948
Argitalpen urtea: 2010
Zenbakia: 44
Orrialdeak: 67-74
Mota: Artikulua
Beste argitalpen batzuk: Procesamiento del lenguaje natural
Laburpena
Este trabajo presenta un estudio sobre el rendimiento de diferentes métodos de selección de características aplicados a la tarea de clasificación de preguntas en diferentes idiomas. El estudio se ha realizado sobre un corpus paralelo de preguntas en cuatro idiomas: inglés, español, italiano y catalán.
Erreferentzia bibliografikoak
- Bisbal, Empar, David Tomás, Lidia Moreno, José L. Vicedo, y Armando Suárez. 2005. A multilingual svm-based question classification system. En MICAI 2005, volumen 3789 de LNCS, p´aginas 806–815. Springer.
- Cardie, Claire. 1996. Automatic feature set selection for case-based learning of linguistic knowledge. En Conference on Empirical Methods in Natural Language Processing, páginas 113–126.
- Forman, George. 2003. An extensive empirical study of feature selection metrics for text classification. The Journal of Machine Learning Research, 3:1289–1305.
- Li, Xin y Dan Roth. 2002. Learning question classifiers. En Proceedings of the 19th international conference on Computational linguistics, páginas 1–7, Morristown, NJ, EEUU. Association for Computational Linguistics.
- Sekine, Satoshi, Kiyoshi Sudo, y Chikashi Nobata. 2002. Extended named entity hierarchy. En LREC 2002, páginas 1818–1824, Las Palmas, España.
- Wang, Xizhao y Qiang He. 2004. Enhancing generalization capability of svm classifiers with feature weight adjustment. En KES 2004, volumen 3213 de Lecture Notes in Computer Science, p´aginas 1037–1043. Springer.
- Witten, Ian H. y Eibe Frank. 2005. Data Mining: Practical Machine Learning Tools and Techniques. Morgan Kaufmann, San Francisco, 2 edición.
- Yang, Yiming y Jan O. Pedersen. 1997. A comparative study on feature selection in text categorization. En ICML ’97, p´aginas 412–420, San Francisco, CA, EEUU. Morgan Kaufmann Publishers Inc.
- Zhang, Dell y Wee Sun Lee. 2003. Question classification using support vector machines. En SIGIR ’03, páginas 26–32, Nueva York, NY, EEUU. ACM.