Reentrenamientoaprendizaje semisupervisado de los sentidos de las palabras
- Palomar Sanz, Manuel
- Rigau Claramunt, Germán
- Suárez Cueto, Armando
ISSN: 1135-5948
Año de publicación: 2005
Número: 34
Páginas: 49-66
Tipo: Artículo
Otras publicaciones en: Procesamiento del lenguaje natural
Resumen
Este artículo presenta un algoritmo iterativo-incremental, Reentrenamiento, que adquiere de forma automática nuevos ejemplos anotados semánticamente, asegurando una alta precisión. El algoritmo se inscribe dentro de los métodos de aprendizaje automático basados en corpus y usa los modelos de probabilidad de máxima entropía. Reentrenamiento consiste en la retroalimentación del corpus de entrenamiento, mediante sucesivos ciclos de aprendizaje y clasificación, con nuevos ejemplos clasificados con un grado alto de confianza. Este nuevo método se inspira en los algoritmos de coentrenamiento (co-training) pero asumiendo unas restricciones más fuertes a la boca de decidir qué ejemplos se etiquetan e incorporan a la siguiente iteración y cuáles no.