Intensive use of lexicon and corpus for WSD

  1. Martí Antonín, María Antonia
  2. Vázquez Pérez, Sonia
  3. Montoyo Guijarro, Andrés
  4. Nica, Iulia
Journal:
Procesamiento del lenguaje natural

ISSN: 1135-5948

Year of publication: 2004

Issue: 33

Pages: 147-154

Type: Article

More publications in: Procesamiento del lenguaje natural

Sustainable development goals

Abstract

El artículo trata sobre el uso de información lingüística en la Desambiguación Semántica Automática (DSA). Proponemos un método de DSA basado en conocimiento y no supervisado, que requiere sólo un corpus amplio, previamente etiquetado a nivel morfológico, y muy poco conocimiento gramatical. El proceso de DSA se realiza a través de los patrones sintácticos en los que una ocurrencia ambigua aparece, en base a la hipótesis de "almost one sense per syntactic pattern". Esta integración nos permite extraer información paradigmática y sintagmática del corpus relacionada con la ocurrencia ambigua. Usamos variantes de la información de EuroWordNet asociada a los sentidos y dos algoritmos de DSA. Presentamos los resultados obtenidos en la aplicación del método sobre la tarea Spanish lexical sample de Senseval. La metodología es fácilmente transferible a otras lenguas