martes, 15 de abril de 2014

¿Inglés americano y británico? Los locos locales en las TEnT

Curiosamente, al día siguiente de escribir yo sobre los términos con variantes o las «varias opciones por término», Paul Filkin, la cara visible de SDL, trataba en su blog este mismo tema, también hablando de Glossary Converter, solo que aplicado a las variantes del inglés. También trata en su artículo la creación de una definición de glosario en Multiterm y la concatenación en Excel, temas muy interesantes. ¿Cómo marcar los términos de un glosario como pertenecientes al inglés británico o americano para controlar que no se nos escape la variante equivocada en una traducción al inglés? Muy útil… si trabajas hacia el inglés. Si trabajas desde el inglés estas variantes son más bien un estorbo.

No solo eso. También la insigne @alemanita maldecía la semana pasada que no se pudiera asignar una memoria de traducción en inglés americano a un bitexto (archivo bilingüe) de traducción en inglés británico, y viceversa. Estaba claro que los astros se confabulaban para que hablase de este apasionante tema, del que iba a hablar de todas formas esta semana. Y aquí estoy, dispuesto a aburrir.

Crados se niega a aceptar una memoria porque no coincide la variante de un idioma

(Nota: las variantes de un idioma en informática se denominan locales. No todos los locales son variantes de un idioma, pero eso nos da igual. Aquí solo hablo de inglés británico y de inglés americano, pero Crados cuenta 16 variantes del inglés y 20 del español. Infierno.)

Para empezar: ¿por qué Crados no nos deja combinar las variantes de un idioma que queramos en un proyecto? Al fin y al cabo, podemos utilizar un glosario en_US (inglés americano) en un proyecto en_GB (inglés británico). Paul Filkin lo explicó aprovechando que presentaba la app AnyTM. Crados se apoya en la configuración del proyecto para hacer autosustituciones: reconoce las fechas, cantidades y medidas del en_US y nos las convierte al es_ES (español de España), según la Configuración regional de nuestro Windows. Y estos numeritos se escriben en la memoria. Si tenemos una memoria en_US con los numeritos que siguen las reglas del en_US y luego queremos usar esa memoria en un proyecto en_GB, podemos liarla. Al fin y al cabo, 1/2/14 es el 2 de enero en en_US o el 1 de febrero en en_GB. Crados nos trata como niños y nos impide reutilizar una memoria para un locale distinto.

Sin embargo, todo esto presupone que un proyecto se crea con el locale correspondiente de verdad al texto. Que levanten la manita los gestores de proyecto que, antes de crear un proyecto, miran en qué variedad de inglés está el texto. ¿Nadie? ¿Hay un loco por ahí que sí lo hace? Bien. La mayoría de veces un proyecto se crea con el locale del país donde se encuentra el cliente, que puede ser una agencia que rebota archivos que le llegan desde otra parte del mundo, aunque en otras ocasiones se crea con el locale al que estén acostumbrado el gestor de proyecto, sin más. En la práctica, la probabilidad de que el locale del proyecto coincida con el texto es del 50 %: una mera coincidencia. Así, todo aquello que he contado en el párrafo anterior sobre la correcta autosustitución es pura entelequia.

Existen tres formas de mezclar variantes de inglés en un proyecto:

  1. Exportar la memoria a TMX o similar e importar en otra memoria con el locale que nos interesa. Trados Studio no se queja si el locale del TMX es distinto a la memoria en la que vamos a importarlo. Este método es una verdadera puñeta, porque tienes que exportar, modificar e importar cada vez que la otra memoria se actualice (porque el cliente te envía la nueva versión de la memoria, porque has tenido que trabajar con proyectos de otro locale…), además de mantener un registro para acordarte de mantenerla al día.
  2. Utilizar AnyTM, una app de pago (y no precisamente barata) con la que podremos aprovechar las memorias que queramos, sean del locale que sean (incluso una memoria alemán>español en un proyecto neerlandés>español, si nos apetece), en los proyectos que queramos, sean memorias locales o remotas y sean memorias de Trados Studio, de Trados Workbench, de SDLx o de lo que sean.
  3. No usar Crados, sino memoQ. He estado haciendo pruebas y permite trabajar sin problema alguno con memorias con un locale distinto al proyecto/bitexto, sin quejarse ni una sola vez. De hecho, incluso puedes escoger inglés y español a secas, sin especificar el país.
¿Por qué Crados no se limita a preguntarte si estás seguro de asignar una memoria con un locale distinto al proyecto? Al fin y al cabo, SDL reconoce que la app AnyTM es útil y necesaria. Lo explica Paul Filkin en los comentarios de su artículo. Respuesta corta: por pereza. Respuesta larga: por no romper algo que funciona mal, pero funciona, en muchos productos distintos de SDL (no solo Trados Studio), porque desde hace unos años SDL prefiere dejar que apps de terceros añadan funciones necesarias que deberían añadir ellos de serie.

Por su parte, memoQ no solo te permite añadir la memoria que quieras, sino que combina los resultados de la memoria con glosarios locales y remotos, además de mezclar trozos de la memoria (subsegmentos). Por ejemplo:
  • Segmento 1, sin coincidencias en la memoria: tú traduces «Press HOME» por «Pulse HOME».
  • Segmento 2, sin coincidencias en la memoria: tú traduces «Enter the Home Menu» por «Acceda al menú Inicio».
  • Segmento 3, sin coincidencias en la memoria: te traduce él solito «Press HOME to enter the Home Menu» por «Pulse HOME to Acceda al menú Inicio», corriges la frase y listo.
Un crack, el tío. Y esto es solo un ejemplo básico del autoensamblaje de memoQ, que ya hacía Déjà Vu desde los años 90, pero ahora es mucho más inteligente, claro. Por si os interesa, en mayo hay un taller de memoQ en Madrid coorganizado por Con Trazo Firme y Meowtrad e impartido por Belén Agulló. Que parece que me lleve algo por recomendar memoQ o este taller, pero no.

lunes, 7 de abril de 2014

Conversión de glosarios en Crados y en memoQ

La semana pasada me topé con un glosario bastante útil (con fallitos, pero útil) de términos industriales de la OSHA. Si os fijáis, tiene varias opciones para cada término, separados por comas, además de otras malas prácticas que impiden que se pueda aprovechar el glosario para aumentar la productividad en una TEnT. En Crados-Multiterm (nombre «cariñoso» otorgado por Mox al Trados) se pueden importar glosarios de forma farragosa (pasando por varios asistentes en Multiterm Convert y Multiterm Desktop) o de forma muy sencilla gracias a la app externa Glossary Converter. ¿Cómo trató Glossary Converter estas múltiples opciones por término? No las trató.

Glosario mal importado a Multiterm

Posteriormente me di cuenta de que ya había salido la versión 3 de Glossary Converter en el SDL OpenExchange y yo todavía estaba en la 2. ¿Cómo me enteré de que había una actualización? Entrando en la web, sin más. Ni la propia app ni Crados te avisa cuando hay una versión nueva. Supongo que Crados 2014 sí que avisará, porque tiene las apps integradas en la interfaz, pero los que estamos con 2011 o con 2009 no tenemos esa suerte. Al ver que Glossary Converter 3 ya permitía ajustes, investigué, y la opción «Sinónimo activado compatible con formato excel» parecía prometedora, pero como yo no hablo ese idioma, preferí cambiar la interfaz al inglés. Ahora sí, «Activate synonym suport in Excel files». Tela con la localización al español de la app.

Opciones de importación de Glossary Converter

Ahí especificas cuál es el separador de opciones dentro de un mismo término y entonces sí te lo convierte bien. Este es el resultado.

Glosario bien importado a Multiterm

Es curioso que SDL deje una parte tan importante de su funcionalidad (conversión de glosarios, casi nada) en manos de terceros. Me pregunto qué habría pasado si en su día Crados no se hubiera alzado con el título de estándar de facto, si hubiera ganado quien realmente se lo merecía (de los 90 me quedo con Déjà Vu), o al menos, si no hubiera habido un claro ganador. Me pregunto si hoy día la mayoría de traductores que trabajen con TEnT aprovecharían el aumento de productividad y de calidad que supone que un entorno de traducción a) te sugiera términos cuando corresponde, b) te permita autocompletarlos con solo teclear un par de veces y c) te permita hacer un control de terminología semiautomatizado. Algún día me gustaría escribir una ucronía tipo Let's Kill Hitler!/Making History/Misfits 3×4, pero con Crados, si no fuera porque no es lo mío. En fin.

El caso es que, al igual que la última vez que hablé de glosarios aquí, me pasé por memoQ a ver cómo trataba esta TEnT un glosario con varias opciones por término. Y bien, oye, bien. No solo tiene suficientes opciones, sino que también te previsualiza cómo quedarán los campos.

Ajustes de importación de terminología de memoQ

Este glosario necesitó varios ajustes antes de poder utilizarse cómodamente en una TEnT. Tuve que separar lo que consideré notas de uso (categoría gramatical, contextos, aclaraciones) en otros campos y completar ciertos términos que en sus opciones alternativas solo incluían la segunda parte del término. Todo esto antes de convertirlo, todavía en Excel, que es más cómodo. Aquí tenéis el glosario de términos industriales de la OSHA, en TXT con tabulaciones, listo para cargar en memoQ, en Multiterm y en TBX (estándar de terminología que no usa nadie): Dropbox, Google Drive y Microsoft OneDrive.

Antes de acabar, quería recomendaros el taller de memoQ en Madrid el 10 de mayo que impartirá Belén Agulló. Yo acabo de apuntarme porque, por las razones que cuento aquí y alguna que otra más que contaré en las próximas semanas, me estoy cansando de ciertas tonterías de SDL y memoQ me está gustando mucho, con lo que voy a pasarme progresivamente a memoQ. A Belén prácticamente no la conozco, pero sé que estuvo en un memoQFest, que está certificada como profesora por Kilgray (los desarrolladores de memoQ) y me da la impresión de ser muy inteligente. Tenéis hasta el 10 de abril para apuntaros a precio reducido y, mientras os decidís, podéis apuntaros a un webinario gratis de memoQ. Yo estaré en el del día 9 de abril y en el del 15.

viernes, 7 de febrero de 2014

¡Que vienen los robots! ¡Cojan sus profesiones y huyan!

Decía Isaac Asimov en los 80* que los robots provocarían grandes trastornos sociales en el futuro, conforme fueran reemplazando trabajadores. Década sí, década también, grupos de profesionales se quedarían en la calle porque una máquina haría su trabajo más barato/más rápido/con más calidad que ellos. Ciertos futuristas optimistas (puede que Asimov entre ellos, no recuerdo) afirmaron que esto no supondría un problema, más bien al contrario: los humanos tendríamos más tiempo libre porque las máquinas se encargarían del trabajo sucio. Y quien dice robots o máquinas, dice software. Pero claro, en un sistema capitalista, el que no produce, no come. Conclusión: si tu trabajo lo puede hacer mejor una máquina, más te vale que te busques otro trabajo.

Lo que me lleva a este artículo de The Guardian sobre cómo los ingenieros (léase «programadores») de Google llegan más lejos, más alto y más fuerte que los diseñadores. La idea es dar con un tono de azul que haga que los usuarios pinchen más en los enlaces. En lugar de preguntar a un diseñador experto, hicieron pruebas. Dividieron el azul en muchos tonos y asignaron cada tono a un grupo de usuarios, que participaron en el estudio sin saberlo: el grupo que más clics atrajese es el que tenía el azul más atractivo. Con esta técnica se calcula que ganaron 200 millones de USD más. Ahí es nada. Dame suficientes datos y moveré el mundo, que diría Google. En la práctica: el trabajo de un diseñador lo hizo una máquina, mucho mejor de lo que él podría haberlo hecho. Y claro, de ahí el comentario de un diseñador jefe de Google que se largó de la empresa: «Hace poco participé en un debate sobre si un borde tendría que tener un grosor de 3, 4 o 5 píxeles y me pidieron que demostrase mi elección. No puedo trabajar en un entorno así; me he cansado de pelear por tales nimiedades. En el mundo hay retos de diseño más interesantes».

Obviamente los diseñadores no están obsoletos, pero las máquinas más listas pueden hacer el trabajo de los diseñadores menos preparados en ciertos contextos. Incluso de los más preparados, como en el caso anterior. Así, ese diseñador experto tiene que buscarse otro nicho en el que sí aprecien su trabajo. Si las máquinas te comen el terreno por abajo, tendrás que hacer trabajos más selectos, a los que estas no lleguen… todavía. A lo que vamos. ¿Puede una máquina traducir mejor que un humano? Hoy en día, en general, no. Sin embargo, en ciertos contextos lo hace suficientemente bien. Si bien una máquina puede equivocarse de una forma mucho más espectacular que un humano, ciertos errores típicos de un humano no los comete una máquina. Pero hoy no estamos debatiendo quién la tiene más larga. Hazte una pregunta, joven traductor: ¿qué pasa si dentro de 5 o 10 años alguien da con la fórmula mágica para «traducir a máquina» textos técnicos y tus clientes ya no te necesitan?

¡Corred, insensatos!
Seguro que piensas que es imposible. ¿Qué crees que pensaría hace 10 años ese diseñador que decidió largarse de Google? Exacto. Imagínate si me caló hondo lo que dijo @ollicarreira hace unos meses que todavía lo recuerdo: «yo me levanto todos los días pensando qué haría si mañana Google inventa un traductor perfecto. Y me pongo a pensar». Bueno, estoy parafraseando, que no soy una máquina ;) Yo estoy especializado en traducción técnica (informática, farmacia, ingenierías varias) y últimamente hago bastante jurídica (mercantil y civil, sobre todo), pero de vez en cuando hago traducción para doblaje y subtitulación. No es lo que mejor se me da, para qué nos vamos a engañar, pero lo he intentado y me gustaría seguir formándome y mejorar.

Desde mayo de 2013 hasta este mismo domingo he trabajado de community manager, perdón, social media manager. Vamos, que he llevado las redes sociales, he escritos artículos especializados, he actualizado la web y he contestado el correo para cierta editorial. Ha sido un trabajo interesantísimo en el que he tocado muchos palos y he aprendido mucho sobre el mundo de la edición y el marketing, pero he preferido dejarlo para centrarme en lo mío, ya que después de todo ese tiempo no he alcanzado la suficiente eficiencia. Algún día me gustaría dedicarme también a la formación y a la asesoría, y de vez en cuando me gano algunos euros por esto último. El caso es que he intentado abrir nuevas vías de negocio que se escapan de mi zona de confort. Yo no quiero quedarme obsoleto como un móvil antiguo, los lunes al sol. ¿Y tú?

*Nota: No he encontrado referencias exactas a los ensayos de Asimov que menciono, pero @angeldominguez me ha pasado una lista de ensayos de este visionario con buenos candidatos: «Disassembling the Assembly Line», «The Robots are Coming», y «Filling the Brain Gap», entre otros. Lástima que no sean fáciles de conseguir. Supongo que en su día los leí reciclados como prólogos a algunos de sus cuentos.

viernes, 4 de octubre de 2013

Glosario de automoción de ACTA

Esta mañana Patricia Lluberas ha compartido en Twitter un glosario de automoción español-inglés-francés. El glosario es bueno, pero está en PDF, algo muy bonito para imprimir, pero totalmente inútil para aprovechar. Como tengo muchos glosarios acumulados en PDF que en realidad no consulto, he pensado que, por una vez, podría dedicar media hora a sacar algo de provecho: convertirlo a un formato útil para traductores.

Foto gratuita para que no salga mi careto si alguien comparte esto en FB. Manual muy recomendable, en cualquier caso.

Lo he convertido de PDF a Word, de ahí lo he copiado a Excel, he arreglado el desbarajuste de celdas y he usado primero Glossary Converter para convertirlo a Multiterm y luego el propio SDL Multiterm para pasarlo a TBX (formato LISA de intercambio de glosarios, que en realidad no usa nadie) y a texto delimitado por tabulaciones. Este último formato, que es una variante del CSV, sirve como formato de intercambio de facto y puede importarse tranquilamente en memoQ, como acabo de comprobar con la flamante licencia de memoQ 2013 que he adquirido esta misma semana.

Y he aquí el resultado, en Dropbox, Google Drive y Microsoft SkyDrive. Que aproveche.

lunes, 30 de septiembre de 2013

El legado de Miguel Llorens / Miguel Llorens' Legacy

Hoy hace un año hablé de la muerte de un colega, Miguel Llorens. Hoy es el Día del traductor. Este fin de semana en Asetrad X me recordaron que hace casi un año que tengo algo pendiente que compartir con vosotros.

Para evitar que su contribución pública a la profesión se pierda, en octubre de 2012 me dediqué a descargar el contenido de sus dos blogs (uno sobre todo en español, el otro sobre todo en inglés), extraer la parte legible (esto fue vía Readlist de Readability, creo), añadir los comentarios (a mano vía Sigil) y corregir el formato que había desaparecido en la segunda parte del proceso (Instapaper y Pocket no dieron mejores resultados).

¿Por qué he tardado tanto en compartir esto con vosotros? Por cuestiones legales y por respeto. Como Miguel no publicó bajo una licencia tipo Creative Commons para que su obra pudiera compartirse sin ánimo de lucro, no tengo permiso para hacer lo que debo hacer. Un tercero se ofreció a contactar con sus herederos, pero fue dejando pasar el tiempo y llevamos ya un año. Además, la propiedad intelectual de los comentarios no está clara: ¿es del poseedor del blog o de los propios comentaristas? Por otra parte, no es factible contactar con cada comentarista y, como bien sabemos, parte de la gracia de un blog reside en sus comentarios.

Sea como fuere, he decidido que ya ha pasado suficiente tiempo y voy a tener que arriesgarme.

Podéis descargar aquí el legado que dejó Miguel Llorens en sus blogs, que contiene versiones en ePUB, MOBI (para Kindle) y PDF. No tienen una bonita maquetación, pero son funcionales. Si subís más copias a la red para evitar que se pierda en unos años según vayan desapareciendo servicios, decídmelo y actualizaré este artículo. En cualquier caso, como indican los ebooks, «Sus herederos se reservan todos los derechos sobre los textos aquí recopilados»: yo no me llevo un duro y aquí no hay publicidad.

Copia 1 (Google Drive), copia 2 (OneDrive), copia 3 (MirrorUpload)

----

A year ago I talked about a colleague's death (in Spanish). Today is International Translator's Day. This past weekend, during the Asetrad X conference, I was reminded that a year has already passed and I still have something to share with you.

To avoid that his public contribution to our profession is lost, back in October 2012 I decided to download the content of his two blogs (one mainly in Spanish, the other mainly in English), extract the readable parts (this was done via Readibility's Readlist, I seem to recall), add the comments (manually with Sigil) and correct the formatting that was lost during the second part of the process (Instapaper and Pocket did not do any better).

Why have I been so long in sharing this with you? For legal reasons and out of respect. As Miguel did not publish under a Creative Commons-type license so that his work could be shared non-profit, I do not have permission to do what I have to do. A third party offered to contact his heirs, but time went on and on, and a year has already gone by. Also, the comment's intellectual property is unclear: does the blog's owner have it or the persons leaving the comments? On the other hand, it is not feasible to contact every single one of them, and as we well know, part of a blog's worth resides in its comments.

Anyway, I have decided enough time has passed, and I will have to risk it.

You may download here the legacy that Miguel Llorens left us in his blogs, an archive containing ePUB, MOBI (Kindle) and PDF versions. They have no pretty formatting, but they are functional. If you upload more copies to the net in order to avoid it being lost a few years down the road as online services disappear, please let me know and I will update this blog post. In any case, as the ebooks mention, «All rights reserved to his estate»: I am not charging a cent out of this and there are no ads here.

Mirror 1 (Google Drive), mirror 2 (OneDrive), mirror 3 (MirrorUpload)