Evaluating the LIHLA lexical aligner on Spanish, Brazilian Portuguese and Basque parallel texts
- Caseli, Helena M.
- Nunes, Maria G. V.
- Forcada Zubizarreta, Mikel L.
ISSN: 1135-5948
Año de publicación: 2005
Número: 35
Páginas: 237-244
Tipo: Artículo
Otras publicaciones en: Procesamiento del lenguaje natural
Resumen
El alineamiento de palabras y de unidades multipalabra desempeña un papel importante en muchas aplicaciones del procesamiento de lenguaje natural, tales como la traducción automática basada en ejemplos, la inducción de reglas de transferencia para la traducción automática, la lexicografía bilingüe, la desambiguación de la polisemia, etc. En esta comunicación describimos LIHLA, un alineador de palabras que utiliza léxicos probabilísticos bilingües generados por un paquete de herramientas libremente disponible (NATools) y heurísticas independientes del idioma para encontrar alineamientos entre palabras y unidades multipalabra en textos paralelos alineados por oraciones. El método ha alcanzado una precisión de un 92.44% y un 85.09% y una cobertura de un 91.13% y un 64.66% en textos paralelos escritos en portugués brasileño¿español y español¿euskera, respectivamente