Desambiguación del sentido y del dominio de las palabras con modelos de probabilidad de Máxima Entropía

  1. Palomar Sanz, Manuel
  2. Suárez Cueto, Armando
Revista:
Procesamiento del lenguaje natural

ISSN: 1135-5948

Ano de publicación: 2002

Número: 28

Páxinas: 45-54

Tipo: Artigo

Outras publicacións en: Procesamiento del lenguaje natural

Resumo

En este artículo se presenta un sistema de aprendizaje supervisado para la desambiguación del sentido de las palabras. Dicho sistema se basa en los modelos de probabilidad condicional de máxima entropía. El conocimiento lingüístico se adquiere a partir de un corpus anotado y se representa en forma de atributos (features). Se han estudiado varios tipos de atributos para un conjunto limitado de palabras del corpus DSO. También se ha estudiado la sustitución de los sentidos de WordNet por etiquetas de dominio. En la actualidad, la implementación del sistema no soporta ninguna técnica de suavizado o preproceso complejo, pero sus resultados son buenos si son comparados, por ejemplo, con los de los sistemas presentados en el SENSEVAL-2