Reentrenamientoaprendizaje semisupervisado de los sentidos de las palabras

  1. Palomar Sanz, Manuel
  2. Rigau Claramunt, Germán
  3. Suárez Cueto, Armando
Revista:
Procesamiento del lenguaje natural

ISSN: 1135-5948

Ano de publicación: 2005

Número: 34

Páxinas: 49-66

Tipo: Artigo

Outras publicacións en: Procesamiento del lenguaje natural

Resumo

Este artículo presenta un algoritmo iterativo-incremental, Reentrenamiento, que adquiere de forma automática nuevos ejemplos anotados semánticamente, asegurando una alta precisión. El algoritmo se inscribe dentro de los métodos de aprendizaje automático basados en corpus y usa los modelos de probabilidad de máxima entropía. Reentrenamiento consiste en la retroalimentación del corpus de entrenamiento, mediante sucesivos ciclos de aprendizaje y clasificación, con nuevos ejemplos clasificados con un grado alto de confianza. Este nuevo método se inspira en los algoritmos de coentrenamiento (co-training) pero asumiendo unas restricciones más fuertes a la boca de decidir qué ejemplos se etiquetan e incorporan a la siguiente iteración y cuáles no.