Intensive use of lexicon and corpus for WSD
- Martí Antonín, María Antonia
- Vázquez Pérez, Sonia
- Montoyo Guijarro, Andrés
- Nica, Iulia
ISSN: 1135-5948
Year of publication: 2004
Issue: 33
Pages: 147-154
Type: Article
More publications in: Procesamiento del lenguaje natural
Abstract
El artículo trata sobre el uso de información lingüística en la Desambiguación Semántica Automática (DSA). Proponemos un método de DSA basado en conocimiento y no supervisado, que requiere sólo un corpus amplio, previamente etiquetado a nivel morfológico, y muy poco conocimiento gramatical. El proceso de DSA se realiza a través de los patrones sintácticos en los que una ocurrencia ambigua aparece, en base a la hipótesis de "almost one sense per syntactic pattern". Esta integración nos permite extraer información paradigmática y sintagmática del corpus relacionada con la ocurrencia ambigua. Usamos variantes de la información de EuroWordNet asociada a los sentidos y dos algoritmos de DSA. Presentamos los resultados obtenidos en la aplicación del método sobre la tarea Spanish lexical sample de Senseval. La metodología es fácilmente transferible a otras lenguas