Evaluating the LIHLA lexical aligner on Spanish, Brazilian Portuguese and Basque parallel texts

  1. Caseli, Helena M.
  2. Nunes, Maria G. V.
  3. Forcada Zubizarreta, Mikel L.
Revista:
Procesamiento del lenguaje natural

ISSN: 1135-5948

Año de publicación: 2005

Número: 35

Páginas: 237-244

Tipo: Artículo

Otras publicaciones en: Procesamiento del lenguaje natural

Resumen

El alineamiento de palabras y de unidades multipalabra desempeña un papel importante en muchas aplicaciones del procesamiento de lenguaje natural, tales como la traducción automática basada en ejemplos, la inducción de reglas de transferencia para la traducción automática, la lexicografía bilingüe, la desambiguación de la polisemia, etc. En esta comunicación describimos LIHLA, un alineador de palabras que utiliza léxicos probabilísticos bilingües generados por un paquete de herramientas libremente disponible (NATools) y heurísticas independientes del idioma para encontrar alineamientos entre palabras y unidades multipalabra en textos paralelos alineados por oraciones. El método ha alcanzado una precisión de un 92.44% y un 85.09% y una cobertura de un 91.13% y un 64.66% en textos paralelos escritos en portugués brasileño¿español y español¿euskera, respectivamente