˪朄⭄婆㔯婾⎊˫䫔ᶫ⌟䫔ᶨ㛇炷102 ⸜ 12 㚰炸炻1-41 枩
Providence Forum: Language and Humanities Vol.VII, No.1 (December 2013), 1-41
La factibilidad de utilizar la memoria de
traducción y la alineación como herramientas de
traducción asistida por ordenador en la traducción
de noticias en español y en chino
將電腦輔助翻譯軟體之
“翻譯記憶”及“匹配功能”
應用在西班牙文與中文新聞翻譯之可行性
Kuo-Shih Ho & Hung-Chen Hsieh
ᒺᎌᅘ┘ᡪᢧ!
Departament of Spanish Language and Literature
Providence University, Republic of China(Taiwan)
ᘹጙ⍆ᒯᧈᎇ⅃፲⍆ᖗ!
La factibilidad de utilizar la memoria de
traducción y la alineación como herramientas de
traducción asistida por ordenador en la traducción
de noticias en español y en chino
Kuo-Shih Ho & Hung-Chen Hsieh
Abstract
Advances in technology, from machine translation studies in the twentieth century, to development of computer-aided translation in the present era, information technology has become essential in the translation industry. Recently, there has been increased interest in research into the applicability of these tools, plus development in the Internet to globalize translation. It is not enough for a professional translator to have language skills. They must also be able to find and retrieve information effectively, build and use databases and be familiar with the use of other technological tools. Therefore, in addition to conventional translation methods, it is essential to teach college students these new skills in order to help them adapt to the translation market after graduation.
In Taiwan, studies in translation memory have mainly been focused on Chinese-English, English-Chinese texts. For a long time, the use of theses, dissertations, and published articles in Spanish have been limited to language teaching, applied linguistics, literary criticism and translation. Studies in computer-aided translation tools for Chinese-Spanish and Spanish-Chinese are scarce. For this reason, the main goal of this thesis is to discuss the usage of translation memory and alignment tools in Chinese-Spanish and Spanish-Chinese translations. Through aligning two news texts (one in Chinese-Spanish and the other in Spanish-Chinese) from the Spanish departments in two Taiwanese universities using WinAlign in building a translation memory, there have been found both limitations and structural and phraseology differences between these languages. Limitations include
inappropriate alignment and translation equivalence, lack of textual coherence and proofread standards, and excessive time and effort. Other limitations include WinAlign problem, insufficient quantity of the corpus and so on. We also found that a text with simple-phrase structure is more efficiently aligned.
This thesis discusses only the phenomenon discovered during the alignment process. Whether the corpora are suitable for other computer-aided translation tools or the translation theory and techniques were studied. The results of this research will be a reference for related topics of computer-aided translation software for Spanish and Chinese translations in the future.
Keywords: Translation memory, alignment, news texts, parallel corpus,
WinAlign.
Kuo-Shih Ho, Doctor in History in the Complutense University of Madrid. He is currently Associate Professor at the Spanish Language and Literature, Providence University, Republic of China(Taiwan).
Hung-Chen Hsieh, is postgraduate of Spanish Language and Literature, Providence University, Republic of China(Taiwan).
將電腦輔助翻譯軟體之
“翻譯記憶”及“匹配功能”
應用在西班牙文與中文新聞翻譯之可行性
ᒺᎌᅘ┘ᡪᢧ!
⁸ᢢ!
隨著科技的發展,從二十世紀開始研究的機器翻譯到今日的電腦輔助翻譯,資 訊科技已在翻譯領域中已經扮演不可或缺的地位。近年來,國際上對於這些工具在 應用性及必要性的逐漸重視與討論,再加上全球網路系統的高度發展,通用語言的 翻譯產業已成為全球化。如此,單有某種語言能力的專業譯者,已明顯不足以應付 現今的翻譯需求;除語文能力外,仍必須具備有效搜尋取得資訊、資料庫建立與探 勘利用,以及熟悉翻譯科技工具等多種能力。因此,傳統的翻譯課程中,需要加入 對這些新工具的基礎教育,以協助畢業生能快速進入翻譯就業市場。 國內對於翻譯記憶庫研究的方向,一向以英譯中及中譯英為主,長期以來西班 牙語的相關論文及專業期刊文章也只侷限在教學方法、應用語言學、文學作品翻譯 等領域,對西譯中及中譯西的電腦輔助翻譯工具之研究更是非常陌生。基於此原因, 本論文主要目的是探討翻譯記憶庫及匹配功能在西班牙文與中文翻譯的利用性。透 過 WinAlign 匹配軟體排列兩份台灣兩所大學西語系的西譯中及中譯西新聞文本後, 分析這些平行語料庫所產生的結果,發現多種限制因素,包括不適當的匹配及翻譯 等值、缺乏連貫性及審核匹配結果的標準、耗時、WinAlign 的問題、文本資料庫 數量的不足等。結果也藉由匹配後觀察到這兩種語言的結構及表達方式的不同,及 帶有許多簡單句型結構的文本有較佳的匹配結果。 本論文僅討論在建立翻譯記憶庫時,在匹配過程中所發現的現象,至於文本是 否適用於其他電腦翻譯輔助軟體及其中的翻譯理論及技巧等並不在本論文研究範圍 內。本研究成果可作為未來電腦輔助西中雙向翻譯軟體相關研究之重要參考。 關鍵字:翻譯記憶庫、匹配、新聞文本、平行語料庫、WinAlign。ᒺᎌᅗᒯᧈᎇ᪑⇞ᖾጙ⍆⍹Ꮒ⍆Ვᅗᯀᐞᘹጙ⍆ᒯᧈᎇ⅃፲⍆ᖗᐞ᭖ᭈᅙ! ┘ᡪᢧᅗᘹጙ⍆ᒯᧈᎇ⅃፲⍆ᖗ⃞ᧈᯉỔᅙ!
La factibilidad de utilizar la memoria de
traducción y la alineación como herramientas de
traducción asistida por ordenador en la traducción
de noticias en español y en chino
INTRODUCCIÓN
Sin duda alguna, el uso de la tecnología ha crecido día a día y es de gran importancia en todos los aspectos de nuestra vida cotidiana. Actualmente, los traductores aprovechan y se benefician enormemente de las nuevas tecnologías y los recursos informáticos, tales como Internet, la información en línea, el ordenador, los programas de traducción automática y la traducción asistida por ordenador (TAO), los sistemas de gestión terminológica y, el diccionario electrónico entre otros.
Con los adelantos científicos, desde la investigación en la traducción automática a partir del siglo XX hasta el estudio de la traducción asistida por ordenador en la actualidad, se observa que la tecnología ocupa un rol cada día más importante en el ámbito de traducción (Shih y Cheng, 2006: 46). La diferencia entre estos dos instrumentos es que el último es muy útil para los textos repetitivos como los documentos técnicos de multilenguas.
Justificación del estudio
En el presente trabajo, se aborda la cuestión del uso de la alineación como parte de la memoria de traducción, una herramienta de la traducción asistida por ordenador, en los corpus paralelos bilingües (español y chino). Como los autores usan una herramienta de TAO, Trados, en sus trabajos como traductores a tiempo parcial, se ha descubierto que en ninguna asignatura de traducción, se
enseña ni se aprovechan las herramientas de TAO1 en todos los departamentos
de español de las universidades taiwanesas. Por lo tanto, justificará la posibilidad
1 Las herramientas de TAO se refieren a los programas de la traducción asistida por ordenador, del alineador y de la memoria de traducción.
de utilizar estas herramientas en los cursos de español y para la docencia en el futuro.
Otro motivo es que comparando con los estudios didácticos, literarios, políticos, económicos, y traducidos en el idioma español en Taiwán, la TAO es todavía desconocida. El punto de partida del presente trabajo es comparar el proceso y el resultado de la alineación en dos corpus textuales bilingües. Estos corpus han sido tomados en los departamentos de español de las universidades Providence y Fujen, en el ámbito de periodismo por el alineador WinAlign de Trados.
No se pretende analizar profundamente las técnicas, las normas, las teorías de traducción o las gramáticas de las dos lenguas en los corpus, sino que nos limitamos presentar la teoría de la memoria de traducción y de alineación, y justificar el uso y los fenómenos que surgirán durante el proceso.
Objetivos e hipótesis del estudio
Los objetivos de la presentación son los siguientes:
z Conocer la memoria de traducción y la alineación.
z Probar el funcionamiento del alineador WinAlign en dos corpus paralelos
español-chino y chino-español.
z Comparar, descubrir y proponer las dudas y los resultados posibles en los
dos corpus alineados.
Se propone como hipótesis la siguiente afirmación: La traducción asistida por ordenador es una herramienta para los traductores o los estudiantes de español.
Metodología
Para comprobar la hipótesis, primero hay que entender el significado de las herramientas de la TAO según los estudios e investigaciones pasadas. A continuación, se toman dos corpus de noticias españolas y chinas con sus traducciones, que fueron tomadas de los cursos de traducción de los dos departamentos de español de las universidades Providence y Fujen. El programa WinAlign se utilizó para realizar el proceso de alineación. Posteriormente, se elaboran los resultados de los corpus bilingües alineados.
Marco histórico
Actualemente hay muy pocos trabajos en los que se analice cómo interactúan las traducciones del español al chino y viceversa, mediante las herramientas de TAO.
Lu(2005) escribió en chino un trabajo en el que estudia la traducción automática y TAO de español-chino. La autora manifestó que los trabajos teóricos y el desarrollo de un programa de traducción automática de español-chino son muy escasos si los comparamos con este tipo de estudios en la traducción inglés-español o inglés-chino durante los últimos sesenta años. Dicho artículo narra la historia, el desarrollo y la dirección de la investigación en traducción automática y estudia la importancia de los corpus, los ejemplos y la estadística. Por medio de la comparación de diferentes corpus, analiza las ventajas y desventajas de los textos traducidos, así como los recursos obtenidos de Internet para las investigaciones futuras.
Basándose en los resultados tras comparar las lenguas española y china, estudia sua puntos en común mediante el uso de las funciones de traducción automática. Para incrementar las fuentes y la cantidad de los corpus bilingües, Lu(2005) sugirió tomar las obras traducidas en español y chino disponibles en China y Taiwán, después de solucionar la cuestión de derechos de autor tanto de las obras originales como de las traducciones. También se necesita recoger los materiales escritos por los profesores y los alumnos universitarios de los departamentos de español de las cuatro universidades taiwanesas. Creó una plataforma interactiva no comercial para que los castellano-hablantes de nivel avanzado pudieran registrarse y subir sus trabajos de traducción con el propósito de crear una base de datos de acceso público. Esta recopilación requiere la participación de muchos voluntarios y la acumulación de los datos a largo plazo.
La mayor parte de las investigaciones taiwanesas sobre la memoria de traducción en el ámbito de las lenguas aplicadas se ocupa de la traducción el inglés-chino y chino-inglés, especialmente los trabajos de Shih, Chung- Ling. Esta autora ha publicado dos libros monográficos (2004a, 2006c) y varios artículos (2004b, 2006a, 2006b, entre otros que no están citados en este trabajo) que desarrollan, entre otros temas, los beneficios pedagógicos y los desafíos de estas herramientas, los efectos producidos por la tecnología en los estudios de
traducción, los métodos de enseñanzas de la traducción automática y de la memoria de traducción integrados a los métodos convencionales.
Otros trabajos que podemos encontrar sobre este tema en Taiwán son: las tesinas de máster de Chung, Hsin-Jung (2004) y Chen, Pinchi (2005). La primera analizó los efectos de Trados en la negociación entre los vendedores de localización de softwares y los traducctores en Taiwán. Chen se ocupó de la medida de la exactitud y la eficiencia de la función de la concordancia difusa (Fuzzy Match) de Trados en las traducciones inglés-chino mediante el estudio de las experiencias de los tres traductores.
Por otra parte, merece la pena mencionar la ponencia de Shieh, Shu-Mei (2007) en el estudio de la TAO en la traducción de alemán a chino. En su ponencia, explicaba la relación entre el idioma alemán y la traducción automática a través de un sistema de traducción simple en línea al desarrollado por ella misma, y los problemas derivados de este mecanismo. Ademá, el artículo de Chen, Shing-Lung (2007) discute los problemas en la redacción y la revisión de los resultados de la traducción automática.
Otro trabajo que debemos referir con el propósito de comprender el tema de la memoria de traducción y los problemas del alineador que se está estudiando en el mundo español es la tesis doctoral realizado por Ribas Bruguer, Marta (2006). Su tesis analizó las diferencias discursivas de las sentencias jurídicas del Tribunal Superior de Justícia de Cataluña, en catalán y en castellano usando el alineador ALINEA. Estableció una tipología de fenómenos lingüísticos sobre este tipo de discurso que generaba alineados insatisfechos, proponiendo un tratamiento lexicográfico y estratégias adicionales (normas lingüísticas) para mejorar los resultados de los textos alineados de este tipo especializado.
Estructura del trabajo
En la primera parte, se darán la definición, los antecedentes y, las características de la memoria de traducción. Posteriormente, se acercará la herramienta de alineación automática como uno de los componentes de la memoria de traducción en la descripción, el proceso y el uso.
En la segunda parte, se explicará la metodología del experimento. En la tercera, se presentará los resultados, los descubrimientos, los fenómenos y los errores de los corpus alineados paralelos. Se pretenderá estudiarlos dentro de
nuestras limitadas posibilidades y se recomendarán algunas las soluciones para mejorar los corpus alineados cuando sea posible.
La última parte concluirá con los hallazgos y con las limitaciones, las sugerencias y las perspectivas futuras de nuestros resultados.
1. La memoria de traducción y la alineación
Actualmente, la enseñanza en los cursos de traducción sigue de la forma convencional- el professor asigna tareas o ejercicios a los estudiantes y califica los ejercicios entregados por los estudiantes, y discuten en la clase-. En realidad, los traductores de la presente era dependen cada día más de las tecnologías avanzadas como asistencia a sus trabajos. Colina considera que se debe educar a los alumnos a conocer y usar bien las herramientas de traducción asistida por
ordenador (TAO)2.
A partir de los años ochenta, el trabajo de traducción en el mundo ha iniciado cambios que hacen que los traductores no solamente deban ser profesionales, sino que sepan utilizar las nuevas tecnologías. Esta tendencia implica que los trabajos rutinarios de los traductores serán el diseño de una programación, el manejo de una base de datos terminológica, la pre-edición de documentos, la revisión de los textos traducidos, etc. (GIO, 2004: 1-3).
El uso de TAO va incrementando y es cada día más importante. En El informe de la industria de traducción actual en Taiwán publicado en 2004, la Oficina de Información del Gobierno (GIO) señala que toda la industria de
traducción taiwanesa usa la memoria de traducción3. Los traductores que saben
utilizarla sustituirán a los que no la dominan (GIO, 2004: 3-116).
2 Citado por Liao, 2007.
3 Según los resultados de la investigación que se presentaron en este Informe, los pesos del uso de la memoria de traducción para los participantes son el 2,71 para los servicios/agencias de traducción, el 2,71 para las compañías con servicios relacionados con traducción, el 5,00 para los agentes de la localización, el 2,20 para las corporaciones de radiodifusión y televisión, el 1,87 para los servicios de publicaciones, el 2,00 para las agencias de revistas comerciales, el 1,50 para las agencias de revistas no comerciales y el 1,00 para las prensas escritas y electrónicas (GIO, 2004) (traducido por los autores).
1.1. La memoria de traducción 1.1.1. Definición
Hay varias definiciones para las herramientas de traducción asistida por ordenador (TAO). Según Blatt y otros (citado por Baker, 1998: 134), en 1985, los sistemas de TAO son los que realmente hacen la traducción, pero con intervención humana en varias etapas durante el proceso de traducción.
De acuerdo con la explicación de Baker (1998: 134):
“TAO, se define aquí, para cualquier situación, procesa un texto original legible por máquina por las herramientas informatizadas para producir una traducción en la lengua meta con el control del traductor en todas las etapas durante este proceso, y llevando a cabo el proceso intelectual de traducción.”4
Entre varias herramientas de TAO involucradas en el proceso de traducción,
está la memoria de traducción (tranlsation memory, TM)5. Se trata de un fichero
donde un texto del idioma original y uno del idioma meta se encuentran emparejados palarelamente en unidades de traducción. Una unidad de traducción puede ser una palabra, frase, o párrafo. El programa permite comparar los contenidos con los de la memoria, y podrá utilizarlos de nuevo en otro texto del mismo ámbito de especialidad. La memoria le permitirá sacar la mayor parte de los textos ya traducidos anteriormente (Behiels y Antwerpen, 1998: 95).
Según Bonet (2004: 247), una memoria de traducción es fundamentalmente una colección de segmentos (o unidades de traducción) bilingües paralelos, junto
4 El texto original en inglés: “…machine-aided translation, as defined here, occurs in any situation where a mahcine-readable source text is processed by computerized tools in order to produce a target-language translation, with the translator being in control of all stages of this process and performing the intellectual process of translation.” (Baker, 1998:134) (traducido por los autores). 5 La memoria de traducción se abrevia como MT en español, pero son siglas para referirse a la
traducción automática en inglés (machine translation). Para no confundir las siglas MT con el significado de la traducción automática en inglés, se usa TM para indicar a la memoria en este trabajo.
con otra información como el nombre del traductor y del archivo, la fecha de modificación, el ámbito temático y otros.
La figura 1 muestra la teoría del proceso básico de la memoria para producir una traducción.
Figura 1 El proceso básico de TM*
Fuente: Webb, 1992:7 *Texto traducido por los autores
1.1.2. Características de la memoria de traducción
Las memorias de traducción son sistemas para almacenar con diferentes mecanismos que añaden y recuperan contenido. Sin embargo, el fichero está vacío cuando se adquiere, así que hay que hacer el esfuerzo a introducir los datos al comienzo (León, 2002: 1).
Con la tecnología de la TAO ha cambiado la forma de traducción y, por lo tanto, la operación humana debe realizarse junto con la máquina. Se necesita un traductor con capacidad tecnológica informática y de lengua cuando se encarga en las etapas de la post-traducción en la memoria, post- y pre- traducción de traducción autómatica (Shih y Cheng, 2006: 46-47). Una de las grandes diferencias entre los procesos de traducción convencional y las herramientas de TAO es que al trabajar con TM, no solamente se construiría un glosario que podrá ser utilizado en el futuro, sino también se guardarían los segmentos traducidos como unidades de traducción. De esta forma, se ahorraría el tiempo
para una traducción nueva, o para la actualización o revisión en el futuro (Webb, 1992: 8).
Otra característica de la memoria es la función de concordancia. Si se encuentra una concordancia al cien por cien en el texto orginal, la recupera en el campo de traducción, y el traductor no tiene que volver a traducir. A esto se le llama concordancia exacta (exact matching). Pero el sistema puede buscar también un tipo de concordancias menos exactas, -que se llama concordancia difusa (fuzzy matching)-, que orientan al traductor.
No a cualquier texto se puede aplicar la memoria. El punto central está basado en el uso de unidades de traducción guardadas anteriormente mediante analogías o comparaciones entre el texto que se espera traducir y las unidades de traducción que están almacenadas en la memoria. Por lo tanto, los textos apropiados para utilizar esta herramienta deben contener términos, frases y párrafos repetitivos, como así ocurre en los textos especializados, los manuales de uso y referencia, los textos administrativos o informativos sobre software y hardware, u otros textos con temáticas como la aeronáutica, automotricidad, las telecomunicaciones, las tecnologías digitales, las fuerzas armadas, la meteorología, los informes de tráfico, la bolsa y la medicina. No sirven para textos creativos o expresivos. (Shih, 2006c: 39; Abaitua, 2001: 4).
Por otra parte, según Shei (2002: 298), un sistema estándar de la memoria puede incluir los siguientes elementos:
-La memoria de traducción: los módulos incluye, por lo menos, los archivos de memorias, el programa de búsqueda, el editor de traducción y el glosario.
-El glosario: el sistema de la memoria normalmente incluye un programa de gestión terminológica para manejar el glosario como un diccionario bilingüe (o multilingüe).
-La alineación: el sistema de TM podría contener la capacidad de alinear los textos bilingües.
1.1.3. Las ventajas de la memoria de traducción
La memoria de traducción representa una estrategia que ayuda a reducir los costos de traducción y localización (LISA, 2004: 7).
Si varios traductores compartieran la misma terminología, habría una consistencia en los términos a la hora de trabajar en grandes proyectos. Esta
consistencia ahorra tiempo para una revisión final, y es un factor clave para asegurar la calidad de la traducción (Shih, 2006c: 43). Para grandes proyectos, todos los traductores del equipo pueden compartir las bases de datos de la memoria. Así se aumenta la coherencia y la uniformidad en los términos y las traducciones dentro de un solo proyecto con la mayor rentabilidad de las traducciones realizadas.
Otras ventajas son que apoya varios formatos de archivos sin modificar los documentos originales y permite el mejor manejo en los proyectos. También permite calcular el porcentaje de texto que puede recuperarse de la memoria, lo que hace posible para un director de proyecto controlar el flujo de trabajo, el total de pago y el manejo de personal (Shih, 2006c: 44).
A través del uso de concordancia en el sistema de TM, los pares bilingües apropiados, generados como resultado de la terminología o de la palabra, ofrecen una buena fuente de traducción como referencia de los estudiantes. Además, la capacidad de consultar el banco de datos de la memoria promueve el entendimiento de un tema especializado y mejora la calidad de las traducciones (Shih, 2006a: 47, 49).
Encontramos otras ventajas, como el confirmar que la traducción está completa, o comparar y combinar los proyectos, trabajar el contenido de preguntas y respuestas, reemplazar los términos, y separar las memorias para crear las memorias de proyecto (LISA, 2004: 10).
1.1.4. Desventajas de la memoria de traducción
Los inconvenientes se podrían resumirse del siguiente modo. En primer lugar, los resultados aparecerán a largo plazo. Antes de ser productivos y rentables, los sistemas de TM requieren un laborioso proceso de construcción y optimización de la memoria (Abaitua, 2001: 4). Una solución que pueda aumentar los segmentos bilingües es la herramienta de alineación para, así, integrar las traducciones viejas (si ya existen) al sistema de TM (Webb, 1992: 12).
En segundo lugar, para aprender a dominar y para beneficiarse del software de TM se necesita invertir tiempo y dinero dependiendo de los conocimientos de tecnología informática del usuario (Ortiz-de-Urbina Sobrino, 2001: 365).
Además, el trabajo resulta menos creativo, el lenguaje más uniforme y se pierde de vista la visión global del texto (Strandvik, 2001: 3).
Por su parte, Strandvik (2001: 3) añade que una concordancia sólo indica que el segmento nuevo ya ha sido traducido anteriormente, aunque parcialmente o por completo. Esto no afectaría a la calidad de la traducción, ni modo de encajar el segmento en el texto. Si hay muchos errores y baja calidad en las traducciones pasadas, los errores y las malas traducciones se repetirían en la nueva traducción (Behiels y Antwerpen, 1998: 97). Así como señala Shih (2006c: 65), aunque se pueda aprovechar el uso de la herramienta de alineación guardando los segmentos de fuente y de meta en pares bilingües, al desarollar posteriormenteuna base de datos de TM, hay que tomar medidas en el control de la calidad de estos pares bilingües para evitar una mala traducción anteriormente guardada.
Finalmente, la post-redacción de la pre-traducción realizada por la memoria puede durar más tiempo que un traductor trabajando y corrigiendo con el método convencional (Webb, 1992: 49). Además, la terminología y las bases de datos de TM compiladas presentan el problema de derechos de autor (Shih, 2006c: 66).
1.2. La alineación automática en la memoria de traducción 1.2.1. Definición de la alineación
La alineación automática de traducciones es formar un texto original con el de su traducción a otra lengua, estableciendo con ello un corpus paralelo (Yzaguirre y otros, 2001: 391). El programa revisa automáticamente los textos originales y metas para determinar cuáles son los pares bilingües a alinear. El resultado será un corpus alineado paralelamente como conjuto constituido por unidades en la lengua original que corresponde a las unidades equivalentes en lengua meta (Shih, 2006b).
Por otra parte, la alineación permite reutilizar las traducciones hechas anteriormente e importarlas a la memoria. Ofrece una alineación automática en la primera instancia. Después, se modifica manualmente por el usuario para llegar a una condición ideal de alineación antes de exportarla a la memoria (Ortiz-de-Urbina Sobrino, 2001: 363). Teóricamente, el tamaño de los segmentos alineados puede ir desde una unidad textual particular hasta un texto completo (Macklovitch y Hannan, 1998: 42).
1.2.2. El uso de la alineación
Los corpus bilinügues alineados no solo forman un diccionario bilingüe, un banco de terminologías, y ejemplos para los sistemas de traducción automática (Chen y Chen, 1994: 166), sino también otros usos como:
A. Uso en la docencia
En el marco de la enseñanza, la aplicación de esta herramienta puede resultar de interés para varias situaciones, especialmente (Yzaguirre y otros, 2001: 391-392):
a. Desde el punto de vista del profesor de traducción, para acercarse a las
características del sublenguaje que esté estudiando, situar dificultades de traducción entre dos lenguas y preparar material de base real para sus alumnos.
b. Desde el punto de vista del alumno, para comprender mejor las diferencias léxicas y estruturales entre lenguas diferentes en un mismo ámbito de especialidad.
Por otro lado, Shih (2004b: 93-94) indicó que las ventajas de la alineación y otras herramientas de la TAO para los alumnos son:
a. Comprender el uso de los léxicos culturales en frases completas a través de la búsqueda.
b. Tener la oportunidad de conocer el léxico cultural en diferentes ámbitos y contextos.
c. Comparar el léxico cultural entre la lengua original y la lengua meta
mediante el output de concordancia bilingüe para aprender cómo traducir un término cultural de una lengua a otra.
Esto permite observar “las diferencias estructurales y fraseológicas entre dos lenguas, reflexionar sobre la frontera entre lengua general-lengua especializada, unidad léxica-unidad léxica especializada y ver el grado de especialización de un texto” (Alonso y otros, 2002: 81) y la equivalencia de la traducción.
B. Uso para la traducción profesional
En el ámbito profesional, el uso de segmentos bilingües en pares puede permitir al traductor analizar posibles problemas de traducción y buscar ideas para solucionarlos. Asimismo, los corpus generados se pueden importar a la memoria de traducción para su uso en el futuro (Yzaguirre y otros, 2001: 392), o crear una base de terminologías para “la consulta del término en su contexto,
examinar diferentes colocaciones, o detectar unidades de traducción de dimensiones variables (unidades fraseológicas, oracionales...)” (Quiroz, Tebé y Cabré, 2002: 6).
C. Uso en la investigación
En otras aplicaciones, la gestión de la memoria de traducción por los corpus alineados puede ser valiosa para la herramienta de la TAO y para mejorar los sistemas de traducción automática. Igualmente, los segmentos alineados pueden surgir con “el interés para el desarrollo de estrategias de detección multilingüe de candidatos a términos”, y formar una fuente básica para la preparación de nuevos productos (Yzaguirre y otros, 2001: 392).
2. La metodología de la alineación
La herramienta de alineación WinAlign, un software integrado de Trados, ofrece alineación automática en la primera instancia. Luego revisa el texto para decidir los resultados antes de crear o integrar la nueva traducción con TM. El resultado de la alineación automática es generalmente incorrecto y se necesita una redacción. El traductor puede agregar, eliminar, redactar o modificar directamente los contenidos en la interfaz.
Las muestras para analizar están formadas por dos muestras que se denominan muestra A y muestra B, respectivamente. La muestra A está consistituida por 448 archivos de noticias en lengua española como lengua fuente y sus traducciones en chino como lengua meta. Dichos archivos están disponibles en http://www1.pu.edu.tw/~spanksho, el portal web para la traducción y el análisis de noticias en lengua española del Profesor Paco Ho, del Departamento de Lengua y Literatura Españolas de la Universidad Providence. Ha sido creado con los trabajos de los cursos de traducción que han realizado los estudiantes universitarios y de máster. Cada archivo son dos páginas con varios párrafos.
La muestra B está formada por los ejercicios de traducción de chino a español, y son breves noticias nacionales e internacionales entre los años 2004 y 2005, creado por el Profesor José Ramón Álvarez, del Departamento de Español de la Universidad Fujen. Consta de un total de 37 páginas, con 270 frases en chino como lengua original y su traducción correspondiente al español como lengua meta.
2.1. El proceso de la alineación
El proceso completo de la alineación se divide en tres etapas principales: preparar los corpus de español y chino de las muestras A y B; alinear los corpus de español y chino usando WinAlign; y crear los resultados alineados en una memoria de traducción por medio de Trados Translator´s Workbench.
Cuando termina la alineación, WinAlign abre automáticamente los segmentos bilingües en el editor de alineación. Los segmentos de la lengua original están ubicados a la izquierda, y los de la lengua meta se encuentran en la parte derecha del editor. Las líneas negras solidas entre los segmentos bilingües significan que están alineados al100%. Los guiones se refieren a las unidades de alineación que todavía no están confirmadas (véase la figura 2).
Figura 2 El editor de la alineación
Los segmentos que no están alineados adecuadamente, se pueden corregir directamente en el editor, marcando las unidades bilingües, desconectando la línea al hacer clic sobre las figuras con hojas de papel en color verde con la opción Desconectar al lado de los segmentos mal alineados (véase la figura 3).
Figura 3 Los segmentos bilingües desconectados
Después, se establece un enlace entre los segmentos correctos haciendo clic en la figura de hojas en el segmento de lengua original y dibujando una línea en el segmento correspondiente a la lengua meta (véase la figura 4) .
3. Resultados y análisis de datos
Durante el desarrollo del experimento, se observan varios fénomenos interesantes que se van a discutir en esta parte.
Al finalizar el proceso de alineación y de creación de la memoria de traducción, se obtienen 7.094 unidades y 270 unidades de traducción para las muestras A y B, respectivamente. No sorprnde la gran diferencia en las unidades de traducción alcanzadas para estas dos muestras, ya que el tamaño de los datos de A es mucho más grande que el de B.
En el proyecto alineado entre los textos de noticias en inglés y chino, Xu y Tan (1999: 5) consideran que sería más difícil y habría una tendencia a aparecer más errores si la alineación se produce al nivel de cláusulas compuestas que si se lleva a cabo al nivel de las oraciones simples. Esto coincide con el resultado del experimento, ya que la estructura de la muestra A es más complicada y más difícil definir los segmentos alineados. La muestra A contiene varios párrafos que aumentan la dificultad de alineación e identificación de los sujetos, y duran más tiempo en la revisión, en relación con la muestra B.
En cuanto a los resultados, se observa que exsiten dos tipos de correspondencia entre los segmentos en estos dos idiomas: 1:n y n:1, tomando la idea de Xu y Tan (1999: 4). Esto significa que el segmento de origen que coincide un número n de veces con el segmento meta, y el posterior es al contrario. Por ejemplo, encontramos una relación1:1 cuando un segmento de fuente equivale a uno meta. Se estima por observación que aproximadamente un 25% de los segmentos alineados son 1:2 y 2:1, que muy pocos son 1:3, y que un 75% son 1:1 para la muestra A. Puesto que el número total de frases en el corpus español es diferente que en chino, es normal que algunos segmentos no tengan una correspondencia de 1:1.
En cambio, 268 de los 270 segmentos alineados (un 99%) son de una relación 1:1 para la muestra B, excepto uno de relación 1:2 y otro de 2:1. El contenido de cada segmento es generalmente una frase y, algunos son párrafos que se pueden dividir en diversos segmentos. Sin embargo, se unen segmentos consecutivos para formar uno sólo en determinadas situaciones. A la hora de revisión, se intenta alcanzar una relación de 1:1 para crear más unidades en la memoria de traducción con el fin de obtener un mejor aprovechamiento en traducciones posteriores.
Los siguientes tipos, tomados de los segmentos alineados de la muestra A, revelan los errores del programa, las características y las diferencias observadas entre las dos lenguas, las modificaciones y los cambios producidos tras la intervención de los autores, y las decisiones que se hacen durante el experimento.
3.1. Las oraciones compuestas
La lengua española es una lengua flexional y su ordenación es más flexible. La correspondencia de género y número (y verbo) manifiesta “las relaciones sintácticas entre los elementos que permiten mayor libertad de desplazamientos de estos." (Santacana Feliu, 2003: 5). Las oraciones compuestas en español frecuentemente se traduce dividiendo cada una en varias frases en chino. Hay muchas formas de dividir y reconstruir las oraciones según la expresión más usada en la lengua china (Shen, 2005: 36). Veamos el ejemplo 1. En los segmentos marcados con círculos antes de la revisión, se encuentra un segmento de fuente en lengua española que está ubicado en la parte izquierda de la ventana, alineado con dos segmentos de la lengua meta por el alineador. El texto original es un sólo segmento, 1e (véase la figura 5):
“ Visto desde Washington, a unos 350 kilómetros del lugar en el que se produjo la tragedia, a menos de 50 kilómetros de la ciudad en la que vive la familia del asesino, y a unos 20 kilómetros de la tienda de armas más próxima (la venta no es legal en el Distrito de Columbia, pero sí en el vecino Estado de Virginia), el panorama es diferente.”
Los dos segmentos 1c y 2c del texto meta que hizo corresponder WinAlign son:
“華府離案發地點約 350 公里,距兇手家人住處不到 50 公里,而離最近的武 器販賣店只有 20 公里。華盛頓的哥倫比亞特區禁止販售槍枝,但在毗鄰的維吉尼亞 州卻屬合法。”
Esta conexión 1:2 alineada por el programa falta alinear con el segmento de meta “從華府的角度來看,情況完全不同。” que corresponde a “Visto desde
Washington,... el panorama es diferente” que no está señalado en la figura 5, además
Figura 5 Los segmentos alineados antes de revisión en Ej. 1
Para arreglar los errores alineados y crear una conexión 1:1, se separa el segmento de fuente en tres, y se reconstruye de acuerdo con sus traducciones en los tres segmentos (véase la figura 6). Así:
A. 1e: “Visto desde Washington, el panorama es diferente.”
炼烍1c:“從華府的角度來看,情況完全不同。”
B. 2e: “a unos 350 kilómetros del lugar en el que se produjo la tragedia, a menos de
50 kilómetros de la ciudad en la que vive la familia del asesino, y a unos 20 kilómetros de la tienda de armas más próxima”
炼烍2c: “華府離案發地點約350公里,距兇手家人住處不到50公里,而離最近
的武器販賣店只有20公里。”
C. 2e: “la venta no es legal en el Distrito de Columbia, pero sí en el vecino Estado de
Virginia.”
炼烍3c: “華盛頓的哥倫比亞特區禁止販售槍枝,但在毗鄰的維吉尼亞州卻屬
Figura 6 Los segmentos alineados después de la revisión en Ej. 1
En el ejemplo 2, el segmento español 1e corresponde a dos segmentos diferentes, 1c y 2c, que se representa como una relación 1:2 después de la alineación automática (véase la figura 7).
El texto original es:
“Los mayores de 65 años son el 17% de la población española, pero ocasionan el 50% del gasto sanitario del país (unos 12.000 millones de euros), ocupan el 40% de las camas hospitalarias y representan el 77% del gasto farmacéutico, según datos expuestos por el presidente de la Sociedad Española de Geriatría y Gerontología (SEGG), Isidoro Ruipérez.”
El texto meta que corresponde en WinAlign es:
“根據西班牙老年病理醫學協會主席伊西多羅盧易貝雷茲所公佈的資料指出,
六十五歲以上的老年人只佔西班牙總人口的百分之十七,但卻花費了一半的國家健 保經費,即約一百二十億歐元。此外,不但佔用百分之四十的病床,其藥物給付更
Figura 7 Los segmentos alineados antes de revisión en Ej. 2
Para reconstruir estos segmentos, se inserta un segmento vacío bajo 1e, se corta y se pega la frase “ocupan el 40% de las camas hospitalarias y representan el 77%
del gasto farmacéutico” para emparejar 2c, “不但佔用百分之四十的病床,其藥物給 付更佔百分之七十七。” Después de eliminar las palabras “此外,” se arregla la traducción y se forma una relación 1:1 (véase la figura 8).
3.2. Segmentos inseparables
Sin embargo, hay algunos segmentos que no deben separarse, como el ejemplo 3 con los segmentos alineados de la muestra A.
El texto original es:
“A los ciudadanos considerados indeseables se les imponía una sentencia menos
radical: el ostracismo. Eran obligados a exiliarse durante una década.”
El texto meta es:
“對於不受歡迎的市民處以較緩和的刑罰就是強行放逐十年。”
La traducción usa la conjunción “就是” para formar una frase en lengua
meta. Si los separamos para alinearlos una relación 1:1, quedaría del siguiente modo:
A: 1e: “A los ciudadanos considerados indeseables se les imponía una sentencia
menos radical: el ostracismo.”
炼烍“對於不受歡迎的市民處以較緩和的刑罰就是強行放逐。”
B. 2e: “Eran obligados a exiliarse durante una década.”
炼烍“強行放逐十年。”
Una traducción bien hecha debe ser fiel a la corrección y al estilo. El texto traducido debe manifestar con fidelidad el contenido semántico del original, por lo que se necesita la comprensión suficiente del texto original y la capacidad de reflejar su significado en la lengua meta. El texto traducido debe ser gramaticalmente correcto (ortografía, sintaxis, etc.). Además, es necesario expresarlo con estilo: soltura, agilidad, armonía y elegancia (Santacana Feliu, 2003: 13). En este caso, aunque se logra llegar a una relación 1:1, los resultados anteriores puedan perder la fidelidad de las frases fuente. Por lo tanto, se mantiene la relación 2:1 (véase la figura 9).
Figura 9 Los segmentos alineados 2:1 en el Ej. 3
Encontramos otro ejemplo donde no se recomienda dividir el segmento, el ejemplo 4. Así vemos que el texto original de una frase, se traduce al idioma chino formando dos oraciones (1c y 2c):
“複製桃利羊的其中一名專家表示,他正以醫學研究的理由,申請複製人類胚
胎的許可。桃利羊是世上第一隻從成年的哺乳類動物,所複製出來的哺乳類動物。”
El texto destino en español aparece en una sola frase (1e):
“Uno de los creadores de la oveja Dolly, el primer mamífero clonado de un adulto, ha
dicho que ha pedido permiso para realizar la clonación de embriones humanos para investigaciones médicas.”
Aquí, se observa la diferencia entre la estructura y la gramática de estas dos lenguas que provienen de dos diferentes familias. La diferencia en las estructuras de la oración y en la gramática influye extensivamente en los resultados y, por lo tanto se hace más difícil decidir la alineación correcta. Además, se intentan dividir los grandes en varios más pequeños para formar más unidades alineadas y, a la vez, más unidades de traducción, ya que se produce un aumento de la base de datos de la memoria que servirá para reutilizar, integrar e intercambiar la
información (Cámara, 2001:1). La frase 2c “桃利羊是世上第一隻從成年的哺乳類
動物,所複製出來的哺乳類動物。” explica el caso de la oveja Dolly como información adicional y está puesta después de la frase anterior gracias al uso de una coma para evitar la repetición. En cambio, la traducción que le corresponde la integra como una subordinación, “el primer mamífero clonado de un adulto”, en el mismo párrafo y, por lo tanto, pierde la equivalencia de la traducción como segmento individual para alinear con la frase 2c (véase la figura 10).
Figura 10 Los segmentos que no se recomienda a separar en el Ej. 4
3.3. Los títulos de las noticias alineados
Otro fenómeno que se descubre en los resultados alineados por WinAlign es que el segmento con el título de la noticia no corresponde con la traducción en la lengua meta. Los títulos de las noticas suelen relacionarse con el contexto que expresa y con la cultura que representa. En los ejemplos 5 y 6, “Las magdalenas de
la abuela” que corresponde a “真品哪裡找?” que literalmente lo traduciríamos
como “阿嬤的雞蛋糕”(véase la figura 11), y para el título “Los Reyes Magos ya
no pueden anunciar golosinas” que se alinea con “兒童食品有所限制”, lo vemos
literalmente como “東方三博士已經不能廣告美食佳餚了” (véase la figura 11).
La noticia en el ejemplo 5 se refiere a los problemas de la piratería en las casas rurales y los sitios turísticos, y el ejemplo 6 trata de que los comercios de la industria alimentaria no pueden utilizar las imágenes que tienen gran influencia en los niños, como los Reyes Magos, para la publicidad de los productos que previenen la obesidad infantil. El usuario debe decidir si guardar o eliminar estos pares alineados para integrarlos en la base de datos de la memoria de traducción para su uso posterior.
A partir de estos dos ejemplos, se observa el léxico y los aspectos culturales españoles que aparecen en las noticias. Esto se corresponde al uso de la alineación para la docencia que propuso Shih (2004b: 93-94).
Figura 11 Problema de título en el Ej. 5
Figura 12 Problema de título en el Ej. 6
3.4. La ordenación de las ideas
Los segmentos polémicos de la muestra A aumentan la dificultad de confirmar los alineamientos, tal y como se muestra en el ejemplo 7, con las diferencias en la estructura y ordenación de las ideas entre el chino y el español. De acuerdo con Santacana Feliu (2003: 4), la ordenación de las ideas crea problemas para la comprensión de textos originales, la traducción y la comprensión de textos mal traducidos. Los segmentos alineados por WinAlign son:
“Astana, que antes se llamaba Akmolinsk, pasó a ser capital de Kazajstán –ex
república soviética, de un tamaño cinco veces superior al de España– en 1998: ”,
denominado 1e, que corresponde al segmento de meta 1c “過去稱為阿克莫林斯
克的阿斯塔納,在 1998 年取代新獨立的哈薩克的第一個首都阿拉木圖,成為新都。”
independiente.” Se empareja con el segmento 2c “哈薩克是前蘇維埃聯邦的一個共
和國,面積是西班牙五倍大。”
No obstante, una parte de 1c corresponde al segmento 2e, así como la porción de 1e se ubica en 2c (véase la figura 13 ).
Figura 13 Pares alineados con diferente orden de las ideas en el Ej. 7
Al final, se decidió a combinar los dos segmentos de fuente 1e y 2e en uno sólo. También se hace lo mismo para los dos segmentos meta 1c y 2c, y se alinea al nivel del párrafo en lugar de la frase. Con este ejemplo, se aprecia que la ordenación en español es más flexible que en chino debido a la diferencia sintáctica entre ambos idiomas.
3.5. Los sujetos
En español ocurren muy pocas repeticiones, así como para los sujetos. Sabemos “quién” está(n) hablando de acuerdo con la conjugación de los verbos. Sin embargo, en el idioma chino ocurre que se repite en la oración y a través de varias oraciones. La repetición de palabras (o sujeto) en chino es una exigencia para comprender el texto (Santacana Feliu, 2003: 28).
En el ejemplo 8, como se muestra la figura 14, en ninguno de los segmentos fuente marcados en la parte izquierda de la ventana aparece el nombre del sujeto
explicó, dijo, resumió e indicó. De todas formas, en cada segmento que les
corresponden en la parte derecha aparece su nombre traducido como 拉多.
Figura 14 Comparación de la presencia de sujeto en español y en chino en el Ej. 8
3.6. La colocación del hablante
En chino siempre se tiende a colocar el hablante al frente de la oración, pero en español se puede situar al principio, en el medio o al final. En el ejemplo 9, WinAlign alinea en dos segmentos el párrafo de la lengua original y uno de la lengua meta (2:1) como se muestra en la figura 15:
Segmento 1e: “Hace tiempo que no hablo del techo de cristal, que es el que imponen
los hombres y algunas mujeres llegan a romperlo y alcanzan puestos altos en su empresa. Prefiero hablar del techo de cemento, que es el que colocan las propias mujeres a sus ascensos laborales:”
Segmento 2e: “prefieren no ascender porque saben que las jornadas de trabajo en el
nuevo puesto no les dejará tiempo para la familia, para la vida personal", explica Nuria Chinchilla, directora del Centro Internacional Trabajo y Familia del IESE.”
El segmento meta 1c corresponde a 1e y 2e:
“該研究所家庭暨工作國際中心主任琴琪雅說:「我已很久沒談到男性強加的玻
璃天花板,而一些女性成功打破這個限制,獲得公司的高階職位。我傾向談論水泥 天花板,這是女性對工作升遷的自我設限,她們知道新職位將剝奪個人及與家人相
處的時間,所以寧可不升遷。」”
Figura 15 Colocación del hablante en los segmentos alineados antes de la revisión en el Ej. 9
La hablante es Nuria Chinchilla, directora del Centro Internacional Trabajo y
Familia del IESE, y se ubica al final del párrafo (en 2e), pero en chino se coloca al
principio 該研究所家庭暨工作國際中心主任琴琪雅 en 1c. Para aumentar las
unidades, es preferible separar estos segmentos tan largos, y trasladar el hablante de 2e a 1e para obtener un resultado de conexión 1:1 (véase la figura 16):
El segmento 1e “explica Nuria Chinchilla, directora del Centro Internacional
Trabajo y Familia del IESE, ‘Hace tiempo que no hablo del techo de cristal, que es el que imponen los hombres y algunas mujeres llegan a romperlo y alcanzan puestos altos en su empresa.’”, corresponde al segmento 1c “該研究所家庭暨工作國際中心主任琴琪
雅說:「我已很久沒談到男性強加的玻璃天花板,而一些女性成功打破這個限制,獲
得公司的高階職位。”.
El segmento 2e “Prefiero hablar del techo de cemento, que es el que colocan las
水泥天花板,這是女性對工作升遷的自我設限,”.
Y al final, el segmento 3e “prefieren no ascender porque saben que las jornadas de trabajo en el nuevo puesto no les dejará tiempo para la familia, para la vida personal,” se empareja con el segmento 3c “她們知道新職位將剝奪個人 及與家人相處的時間,所以寧可不升遷。”.
Figura 16 Recolocación del hablante y división de los segmentos alineados en el Ej.9
3.7. Las traducciones no equivalentes
Se descubre que parte del contenido de algunos segmentos emparejados no coincide, como se muestra en el ejemplo 10. El texto original es : “Ni un terremoto
devastador cambiará el curso de su historia.”, y está alineando con la texto meta “任 何的巨變都不會改變西班牙在此的投資。” (véase la figura 17). No aparece ni el significado ni el término de la palabra “inversión”, equivalente en el segmento
fuente a “投資” (inversión), que se encuentra en el segmento de meta. Este tipo
de pares de segmentos, después de guardarlos en la base de datos de la memoria, podría causar problemas o confusión cuando se encuentra ante una concordancia difusa con la lengua de origen.
Figura 17 El contenido no coincide en los segmentos alineados del Ej. 10
Otra discrepancia que también se observa está en el ejemplo 11. Su texto original es:
“Una: su país (no sólo el chico iraquí pide que los norteamericanos salgan inmediatamente de su país, sino que también la holandesa Eva Duvekot hace toda una declaración de principios: ‘Nos falta autoridad y valor para ser nosotros mismos sin pedir permiso’). Dos: la libertad. Prácticamemte todos declaran que en el futuro quieren montar su propio negocio, su empresa, ser independientes, no tener jefes.”
Y su traducción correspondiente es:
“在國家認同方面:伊拉克男孩要求美國人立即離開他的家園;同樣,荷蘭的 杜維克指出:「荷蘭缺乏獨立自主權」。至於個人的自由:實際上,所有的人都希 望未來能自己經營的公司,不受別人使喚。”
Las palabras subrayadas “Una” y “Dos ” no equivalen a la traducción “在國
家認同方面”, que significa el aspecto de la identidad del país, ni a “至於個人的
自由”, que se refiere a la libertad personal (palabras marcadas en la figura 18)
literalmente en los segmentos alineados, sino que provienen relacionados con el contexto. Por falta de una cohesión textual, uno no comprendería estas unidades y la consideraría como errores de traducción.
Figura 18 Falta de equivalencia en los textos de segmentos alineados en el Ej. 11
CONCLUSIÓN
El avance tecnológico ha favorecido los trabajos de los traductores y los cursos académicos de traducción. También han salido beneficiadas, las herramientas de la TAO basadas en memorias de traducción y alineaciones. Según algunos de los autores citados en este trabajo, las aplicaciones de estas herramientas son una ayuda en el campo de la investigación, la traducción profesional y la docencia. A través de este trabajo, se pretende descubrir si las herramientas de la TAO a partir de la alineación de los textos periodísticos con sus traducciones son útiles para los traductores o los estudiantes de una lengua segunda. De este modo, es obvio que resulta necesario trabajar con estos corpus como materiales de clase para los cursos de traducción universitarios. Para llevar a cabo el presente trabajo, de entre los alineadores comerciales que hay, se utiliza WinAlign de la compañía Trados.
Los resultados presentan algunos defectos en la alineación y las equivalencias inadecuadas, los criterios de decisión, la falta de coherencia, el alto consumo de tiempo y esfuerzo, las dificultades para utilizar a corto plazo dicha memoria de traducción en nuevas traducciones, entre otros. Además, hemos llegado a las siguientes conclusiones:
Por un lado, las dos muestras con diferentes formas de organización de las estructuras de los textos resultan diferentes según la intervención de la persona que traduce. El alineador logra establecer una correspondencia de los segmentos en una relación 1:1 con frases simples, como así ocurre en la muestra B, que servirá para obtener un mayor rendimiento en el resultado y una menor ambigüedad en la memoria de traducción creada. Concluimos, pues, que la muestra B es más efectiva y valiosa para una alineación automática, aunque tenga poco valor en el uso de la docencia si lo comparamos con la muestra A, desde el punto de vista de la utilización de corpus paralelos alineados en la memoria de traducción.
Por otro lado, el análisis de corpus alineados en la muestra A permite revelar los problemas y los errores de traducción frente a los errores del programa WinAlign. Con respecto a los errores en los alineados incorrectos, esto se producen debido a las diferencias entre las dos lenguas, por supresión, agregación, y por cambio en los contenidos de un corpus.También pueden
aparecer por las diferencias estructurales, la distribución de los párrafos y la variación de la puntuación, tal y como se observa en la muestra A. Para mejorar este tipo de alineación, se necesita la intervención humana y, así, comprobar si los pares emparejados son realmente equivalentes. Este procedimiento es muy costoso y largo. Para alinear un proyecto compuesto por numerosos archivos individuales, como en la muestra A, se recomienda combinarlos en uno sólo archivo en formato Word para evitar el desorden y el descuido de omitir por error algún documento. De esta forma, se trabajará con más eficiencia y rentabilidad.
Gracias a los estudios realizados hasta el momento, se puede concluir que, en general, el alineador WinAlgin es muy provechso para la docencia y para la traducción profesional. No obstante, las herramientas de la memoria de traducción no intentan reemplazar los cursos de traducción convencionales, sino más bien, complementarlos con nuevos métodos y tecnologías.
Con respecto a las limitaciones de este trabajo, se intenta establecer una memoria de traducción con tipos de noticias variados que justifiquen la eficacia de esta herramienta en las traducciones de nuevas noticias desde el principio. Se categorizan los archivos de las muestras que sirven para comprobar el tipo de noticias con un mayor contenido repetitivo. Sin embargo, la posibilidad de alcanzar tal cantidad es muy limitada para las presentes muestras. De esta manera, este trabajo se concentra en las observaciones y los resultados durante el proceso de alineación con el objetivo de alcanzar los motivos y comprobar la hipótesis de esta tesina.
Asimismo, con un límite en la cantidad de los datos de las muestras, la prueba de sólo un alineador WinAlign y la capacidad del conocimiento en las lenguas aplicadas para ambas lenguas de los autores, el resultado podría ser polémico y un tanto “subjetivo” la manera de determinar alineación. Será beneficioso verificar las mismas muestras con otros alineadores y comparar los resultados.
Acerca de la restricción del programa, falta presentar los detalles de una memoria de traducción, como las unidades totales de traducción, el porcentaje o la cantidad de formas de conexiones del corpus alineado, la revisión de una memoria, entre otros. También es necesario presentar el aviso para los archivos
ya alineados, así como combinar varios proyectos en un sólo corpus paralelo alineado para la exportación de una sola vez.
El tema de esta investigación de traducción y el corpus paralelo alineado en lenguas española y china son todavía desconocidos y nuevos. Por este motivo, se requieren más estudios e investigaciones desde fuentes variadas y textos de un volumen mayor con el fin de comprobar el funcionamiento de las herramientas de la TAO. Lo cierto es que aún hay un largo camino por recorrer para comprender y aprovechar estas herramientas.
BIBLIOGRAFÍA
Libros y artículos en chino
Chen, Shing-Lung(陳欣蓉),〈評論現行機器翻譯譯文修飾研究之缺失並且研擬譯文
修飾研究之具體研究步驟〉,《國立編譯館館刊》,台北市,第35 期,卷 3,2007a,
頁 97-109。
Government Information Office (GIO) (行政院新聞局)(2004)炻《臺灣翻譯產業現況
調 查 研 究 總 結 分 析 報 告 》, 台 北 市 ,2007 年 3 月 10 日 取 自
http://info.gio.gov.tw/ct.asp?xItem=25632&ctNode=3444&mp=1。 Liao, Posen (廖柏森),《翻譯教學淺論》。台北市,2007,2007 年 10 月 9 日取自
http://tati.org.tw/?p=32&page=1。
Lu, Huei Chuan(盧慧娟),〈西漢機器翻譯研究之初探〉,《西漢翻譯學研討會論文集》,
台北:輔仁大學西班牙語文學系,2005,頁 172-191。
Shen, Li (盛力),《西漢翻譯教程》,北京:外語教學與研究出版社,2005。
Shieh, Shu-Mei(謝淑媚),〈電腦輔助德翻中之研究〉,《2007 應用外語國際研討會論 文集》,高雄:國立高雄第一科技大學應用英語系,2007,頁 611-621。 Shih, Chung-Ling(史宗玲),《電腦輔助翻譯 ͲMT&TM》,台北:書林,2004a。 ---〈TRADOS 應用在外語教學及翻譯研究之多元功能〉,《TRADOS 應用論文集》,
台中:畹禾公司,2004b,頁 83-107。
Shih, Chung-Ling y Cheng, Yew-Dick(史宗玲及鄭有迪),〈科技轉向及其對於翻譯
教學、研究之影響〉,《國立編譯館館刊》,第34 期,卷 3,2006,頁 45-58。
Libros y artículos en español y en inglés
Abaitua, Josefa. “Memorias de traducción en TMX compartidas por Internet”, en Revista Tradumàtica, Octubre, no. 0, 2001炻1-6. Recuperado en el 16 de octubre de 2007, de
http://www.raco.cat/index.php/Tradumatica/article/view/29116/28950
Alonso, Araceli y otros (2002). “La utilización de corpus paralelos alineados en la docencia de la traducción y de los lenguajes de especialidad”, en Proceedings of the Second International Contrastive Linguistics Conference. Publicación de la Universidad de Santiago de Compostela. Santiago de Compostela, 71-82. Recuperado en el 20 de abril de 2008, de
Álvarez, José Ramón. Ejercios de traducción de chino a español. Breves noticias
nacionales e internacionales, Años 2004-2005. Universidad de Fujen, Taipei,
2007. Recuperado en el 11 de diciembre de 2007, de
http://www.span.fju.edu.tw/aprendizaje/files/JRAlvarez/Traduccion.pdf
Behiels, Lieve y Antwerpen, K.V.H. “Las herramientas informáticas y la autonomía del traductor”, en Bueno García, Antonio y García Medall, Joaquín (editores). La traducción: de la teoría a la práctica, Servicio de Apoyo a la Enseñanza, Universidad de Valladolid. Valladolid , 1998, 81-100.
Bonet, Josep. “Cuestión de terminología en la Dirección General de Traducción. Las palabras del traductor.”, en González, Luis y Hernúñez, Pollux. (coordinadores). (2004) Actas del II Congreso: El español, lengua de traducción, celebrado en 20 y 21 de mayo, 2004, Toledo, Esletra. Bruselas, 243-254. Cámara, Lidia. “El papel de las herramientas TAO en la documentación técnica
multilingüe”, en Revista Tradumàtica, Octubre, no. 0, 2001, 1-8. Recuperado en el 2 de octubre de 2007, de
http://www.fti.uab.es/tradumatica/revista/num0/articles/lcamara/imp rimir.pdf
Chen, Kuang-Hua y Chen, Hsin-His. “A Part-of-Speech-Based Alignment
Algorithm”, en Proceedings of 15th International Conference on
Computational Linguistics. Kyoto, 1994, 166-171. Recuperado en el 26 de febrero de 2008, de
http://www.lis.ntu.edu.tw/~khchen/writtings/pdf/COLING1994.pdf
Chen, Pinchi. Tesina de master, A Study of the Fuzzy Match Function in CAT
Software Used in Technical Translation in Taiwan. National Taiwan University
of Science and Technology, Taipei, 2006.
Chung, Hsin-Jung. Tesina de master, The Impacts of Translation Memory on the
Buyer-Supplier Relationship – A Case Study of TRADOS in Taiwan's Software Localization Industry. National Taiwan Normal University, Taipei, 2004.
Doval, Juan José A. “La localización: concepto, nuevas tecnologías y requisitos del nuevo traductor de informática”, en Valero Garcés, C. y de la Cruz Cabanillas, I. (editores). Traducción y nuevas tecnologías. Herramientas
auxiliares del traductor. Encuentros en torno a la traducción 4, Universidad de
Gil Biau, José Ramón y Pym, Anthony. “Las memorias de traducción y el olvido del traductor. Apuntes para la pedagogía de un avance tecnológico imperfecto”, en Corpas Pastor, G.. y Varela Salinas, M.J. (coordinadores).
Entornos informáticos de la traducción profesional: las memorias de traducción,
Atrio, Granada, 2003, 287-300. Recuperado en el 11 de febrero de 2008, de
http://www.fut.es/~apym/on-line/memorias_traduccion.pdf
Gómez, Josu.“Una guía al TMX”, en Revista Tradumàtica, Octubre, no. 0.,2001, 1-21. Recuperado en el 7 de diciembre de 2007, de
http://www.fti.uab.es/tradumatica/revista/num0/articles/jgomez/impr imir.pdf
Ho, Kuo-Shih. Ejercios de traducción de español a chino. Recuperado en el 11 de
octubre de 2007, de http://www1.pu.edu.tw/~spanksho/
Hutchins, John. “The Origins of the Translator’s Workstation”, en Mahcine Translation, 13, 1998, 287-307.
Localization Industry Standards Association (LISA). 2004 Translation Memory
Survey. 2004, 1-28. Recuperado en el 4 de febrero de 2008, de
http://www.lisa.org/products/surveys/tm04survey.html
Macklovitch, Elliott y Hannan, Marie-Louise. “Line ‘Em Up: Advances in Alignment Technology and their Impact on Translation Support Tools”, en Machine Translation, 13, 1998, 41-58.
Ortiz-de-Urbina Sobrino, Paloma. “Aplicación de recursos informáticos en traducción especializada económica directa alemán-español”, en Valero Garcés, C. y de la Cruz Cabanillas, I. (editores). Traducción y nuevas
tecnologías. Herramientas auxiliares del traductor. Encuentros en torno a la traducción 4, Universidad de Alcalá. Madrid, 2001, 359-367.
Quiroz, Gabriel; Tebé, Carles y Cabré, Teresa. “Metodología de elaboración de terminología bilingües en programas de memoria de traducción”, en Actas
del VIII Simposio Iberoamericano de Terminología. Cartagena de Indias, 2002,
6-23. Recuperado en el 2 de octubre de 2007, de
http://www.riterm.net/actes/8simposio/Quiroz_Tebe_Cabre.htm
Real Academia Española (RAE). Diccionario de la lengua española, 22a ed, 2001.
Ribas Bruguer, Marta. Tesis de doctorado, Alineació de textos jurídics paral·lels
(català-castellà): alguns problemes.Institut Universitari de Lingüística
Aplicada, Universitat Pompeu Fabra, Barcelona, 2006.
Santacana Feliu, Ramón. Traducción aplicada del chino al español, 2ed. Kaun Tang International Publications Ltd, Taipei, 2003.
Shei, Chi-Chiang. “Teaching Machine Translation and Translation Memory Systems”, en Studies of Translation and Interpretation, 7, 2002, 297-322. Shih, Chung - Ling. “Teaching Translation Memory : A Case Study”, en English
Teaching & Learning, 2006a, 47-68.
---- “Using Trados WinAlign to Teach the Translation Equivalence Concept”, en Translation Journal, 2006b. Recuperado en el 3 de marzo de 2008, de http://accurapid.com/journal/36edu1.htm
---- Helpful Assistance to Translators: MT & TM. Bookman Books Ltd., Taipei, 2006c.
Strandvik, Ingemar. “Las memorias de traducción en la Comisión Europea”, en Revista Tradumàtica, Octubre, no. 0, 2001, 1-4.
Trados Incorporated. WinAlign User Guide.Trados Incorporated, 2005, 1-96.
Webb, Lynn E.. Tesina de master, Advantages and Disadvantages of Translation
Memory: a Cost/Benefit Analysis. Monterey Institute of International Studies,
California, 1992. Recuperado en el 1 de febrero de 2008, de
http://www.webbsnet.com/translation/thesis.html
Xu, Donghua y Tan, Chew Lim. “Alignment and Matching of Bilingual English–Chinese News Texts”, en Machine Translation, 14, 1999, 1–33. Yzaguirre, Lluís de y otros. “Alineación automática de traducciones: descripción
y usos en los ámbitos de la profesión, de la docencia y de la investigación traductológica”, en Valero Garcés, C. y de la Cruz Cabanillas, I. (editores).
Traducción y nuevas tecnologías. Herramientas auxiliares del traductor. Encuentros en torno a la traducción 4, Universidad de Alcalá. Madrid,2001,