Extracción de relaciones sintagmáticas de corpus anotados

  1. Navarro Colorado, Borja
  2. Moreno Monteagudo, Lorenza
  3. Martínez Barco, Patricio
Revista:
Procesamiento del lenguaje natural

ISSN: 1135-5948

Año de publicación: 2006

Número: 37

Páginas: 67-74

Tipo: Artículo

Otras publicaciones en: Procesamiento del lenguaje natural

Resumen

En este trabajo se presenta un nuevo recurso, diseñado con el objetivo de ser usado en desambiguación semántica de las palabras en español, basado en las relaciones sintagmáticas entre las palabras. Las relaciones sintagmáticas son relaciones entre sentidos dentro de un sintagma o dentro de una oración. En nuestro caso, estas relaciones han sido extraídas de un corpus anotado manualmente, corpus Cast3LB. Este corpus ha sido anotado con información sintáctica (constituyentes y funciones) e información semántica (sentidos de WordNet). De este corpus se han extraído aproximadamente 3000 patrones. Cada patrón muestra la relación sintagmática entre el sentido del verbo y el sentido de sus argumentos dentro de una oración. Sin embargo, estos patrones son excesivamente específicos para ser usados en contextos multilingües o en documentos de dominio general. Para solucionar esto es necesario obtener patrones más generales semánticamente, para lo cual se ha utilizado la ontología SUMO.