Sistema de adquisición automática de reglas gramaticales

  1. Peral Cortés, Jesús
  2. Ferrández Rodríguez, Antonio
  3. Navarro, B.
  4. Martínez Barco, Patricio
Revista:
Procesamiento del lenguaje natural

ISSN: 1135-5948

Año de publicación: 1998

Número: 23

Páginas: 110-117

Tipo: Artículo

Otras publicaciones en: Procesamiento del lenguaje natural

Resumen

En este trabajo presentamos un sistema automático de extracción de reglas sintácticas a partir de un corpus etiquetado con sus categorías gramaticales. Planteamos un sistema de definición de patrones sintácticos sencillo que es capaz de identificar las construcciones sintácticas de sintagmas nominales, sintagmas preposicionales y sintagmas verbales así como algunos subconstituyentes tales como las entidades. Además, el sistema está definido por niveles lo que le hace ser fácilmente adaptable a otros tipos de constituyentes y subconstituyentes según las necesidades del sistema. El sistema ha sido experimentado con un fragmento de corpus conteniendo 250 oraciones (aproximadamente 9600 palabras) etiquetadas y corregidas manualmente obteniendo en una primera aproximación un total de 335 reglas distintas que fueron analizadas manualmente detectando posibles fallos en la definición de patrones. Gracias a la flexibilidad que proporciona el sistema, una segunda definición de patrones que nos permite solucionar gran parte de los problemas detectados en el análisis mencionado, junto con una importante simplificación del conjunto de etiquetas gracias a la construcción de un interfaz previo, nos proporciona un conjunto de 72 reglas distintas acercando nuestro trabajo a los objetivos planteados.