Lenguaje controlado aplicado a la traducción automática de prospectos farmacéuticos
- seoane vicente, angel luis
- Javier Franco Aixelá Director
Universidad de defensa: Universitat d'Alacant / Universidad de Alicante
Fecha de defensa: 30 de noviembre de 2015
- Isabel García Izquierdo Presidente/a
- Adelina Gómez González-Jover Secretaria
- Bertha María Gutiérrez Rodilla Vocal
Tipo: Tesis
Resumen
Lenguaje controlado aplicado a la traducción automática de prospectos farmacéuticos Introducción Esta tesis doctoral surge del interés por establecer un método pautado de creación de lenguajes controlados para su aplicación en la traducción automática de géneros textuales específicos. En este sentido, hemos constatado que los lenguajes controlados tienen como meta restringir la manera de escribir mediante normas que afectan a la gramática, al léxico y al estilo para facilitar o bien la comprensión de textos por lectores humanos o bien su procesamiento mediante herramientas de tratamiento de textos, con una atención muy especial a la traducción automática. En realidad, los lenguajes controlados no son sino una vertiente más de la norma retórica dominante, sobre todo en los textos científico técnicos, que tiende a favorecer la simplificación mediante una prosa clara y sencilla. A esta norma pertenecen también otras iniciativas como la Plain English Campaign o el español neutro. La industria farmacéutica no es ajena a esta tendencia general. En nuestro estudio, caracterizamos el discurso médico como denso y complejo. A estas características se une la heterogeneidad del estilo en que están redactados los numerosos y variados textos que dan forma a los distintos tipos textuales médicos. La variedad depende del registro (oral u escrito) y del tenor que establezcan los interlocutores (emisor y receptor). Ahora bien, la industria farmacéutica es productora de un volumen ingente de textos traducidos, entre los que destacan los protocolos de investigación clínica, las fichas técnicas de medicamentos y los prospectos. Dada su relevancia para la salud pública, la industria se ve obligada a cumplir con las directrices de estilo que le imponen los organismos regulatorios competentes. Y, concretamente en el campo de los prospectos, otra vez, la norma retórica dominante impone con especial ahínco la claridad expositiva y el foco en la capacidad de comprensión del destinatario, o sea, el paciente potencial, al que se supone lego en la materia. Por otro lado, es indudable que la traducción de textos supone una cuestión gravosa para la industria farmacéutica no sólo en términos económicos sino también regulatorios y operativos. En este marco, hemos considerado pertinente plantear una tesis doctoral que indague en la manera de optimizar la traducción automática de textos pertenecientes al género de los prospectos farmacéuticos. Para esta tarea, hemos empleado los lenguajes controlados, dado que se trata de una herramienta cuyo uso aún no ha sido explorado en profundidad, tanto en lo que se refiere a su aplicación a sistemas de traducción automática estadística, y más de acceso gratuito a través de Internet, como en la evaluación cuantitativa de la posible tasa de mejora de las traducciones resultantes. Nuestro método parte del estudio de las dificultades que el sistema Google Translator Toolkit encuentra al traducir prospectos farmacéuticos del inglés al español peninsular. Una vez halladas las dificultades y definidas las reglas del lenguaje controlado, traducimos, en idénticas condiciones, los textos controlados a fin de contrastar los resultados con los obtenidos en la traducción inicial no controlada. El objetivo general se basa en la hipótesis de trabajo siguiente: «Los lenguajes controlados contribuyen a incrementar la calidad de los textos traducidos mediante sistemas de traducción automática». En este sentido, el trabajo cubre una laguna presente en abundante bibliografía sobre la cuestión, puesto que apenas se han descrito estudios empíricos con el nivel de detalle que planteamos, tanto en la descripción rigurosa de la metodología empleada como en la evaluación cuantitativa y estadística de la posible mejora de la calidad de los textos obtenidos en lengua meta. Parece conveniente acotar el experimento a un género textual a fin de incrementar las posibilidades de éxito, dada la reducción de las opciones lingüísticas y de las interpretaciones semánticas del léxico que éstos aportan. Los prospectos de medicamentos se presentan como un primer candidato idóneo para nuestro estudio, gracias al volumen importante de léxico y de macroestructuras textuales que se repiten. Además, la elección del género de los prospectos se muestra especialmente interesante, dado que éstos viven en la actualidad un proceso de simplificación del registro hasta un nivel de habla informal, tras muchos años de sujeción a un registro culto. Dicho proceso se inscribe en un fenómeno general de simplificación de la prosa y el mensaje. Desarrollo Básicamente, el procedimiento experimental consistió en traducir el corpus mediante la herramienta de traducción automática. Posteriormente, analizamos los textos traducidos en busca de incorrecciones lingüísticas y de sentido. Detectados estos problemas, diseñamos el lenguaje controlado con vistas a solucionar el mayor número posible de dichos problemas o errores. A continuación, reescribimos la muestra experimental siguiendo las normas que componen el lenguaje controlado y volvimos a introducir la muestra en la misma herramienta de TA, a fin de constatar la posible mejora del rendimiento de la herramienta. En concreto, las cuatro fases consistieron en: 1) traducir las distintas muestras originales no controladas mediante un sistema de traducción automática para, posteriormente, evaluar los resultados en busca de puntos débiles de dicho sistema 2) recopilar las normas existentes en la bibliografía y diseñar otras de creación propia a fin de solventar las debilidades constatadas en la fase anterior 3) aplicar el lenguaje controlado, primero al subcorpus de oraciones de longitud superior a veinte palabras 4) después, aplicar el lenguaje controlado al corpus general Conclusión Después de aplicar las distintas fases de nuestro método, los resultados son concluyentes en apoyar la hipótesis de partida. Además, nos revelan, por una parte, cómo influyen las normas del lenguaje controlado sobre los textos meta y, por otra, qué tipos de normas son más eficaces en una primera aproximación, si bien observamos que no es posible determinar la eficacia de una norma concreta cuando se aplica en conjunto con otras normas. Entre las áreas que ofrecen un mejor rendimiento, encontramos aquellas relacionadas con la restitución de elementos gramaticales omitidos, la modificación del léxico y de la puntuación, la simplificación de sintagmas nominales complejos y la explicitación de la anáfora. En general, podemos concluir que el uso de lenguajes controlados es positivo si se cumplen los requisitos operativos de partida que hemos empleado en nuestro estudio: de un lado, un sistema de traducción automática estadístico muy potente; del otro, un género textual donde abundan las estructuras sintácticas y las frases prefijadas.