viernes, 22 de enero de 2010

Antes de la postedición, vino...

la preedición*, claro.

Leo en un blog no oficial de Google que los resultados de la traducción automática de Google mejoran "sorprendentemente" al cambiar una simple mayúscula. Bueno, más que cambiar, se corrige una frase que empieza con minúscula incorrectamente.

Se entiende por postedición el proceso y producto de que un un traductor humano corrija y apruebe la salida de un motor de traducción automática. Una postedición puede centrarse en trasmitir el mismo significado que el original, en presentar una frase correcta lingüísticamente o en respetar ambas coordenadas. El perfil de un posteditor suele ser distinto del de un traductor, y podría decirse que se acerca más al de un revisor. En muchos ámbitos, el objetivo de la postedición no es cambiar la frase meta por completo, para eso es preferible comenzar desde cero en lugar de aprovechar la potencia de un motor. El objetivo de la postedición es cambiar lo mínimo posible para que el resultado sea válido, sean cuales fueren las coordenadas de calidad. Posteriormente, las correcciones se alimentan al motor de traducción para que aprenda.

De igual manera, la preedición consiste en preparar una frase origen para que el motor la pueda procesar de forma óptima. Lo cierto es que esta práctica se ha conocido como "lenguaje controlado" desde hace ya unos cuantos añitos. Esta práctica sienta raíces en el inglés básico de Ogden, que quiere enseñar inglés en 850 palabras: es como el típico método de "aprenda inglés en 7 días". En el mundo de la traducción, el ejemplo más conocido de lenguaje controlado es el Caterpillar Technical English o CTE (enlace a PDF, muy interesante) que revolucionó la escritura técnica de documentación, concibiéndola desde el principio para ser traducida más que como obra de arte.

En el ejemplo que comentaba al principio, la preedición que se hace consiste simplemente en corregir la puntuación de una frase mal escrita. En el caso del lenguaje controlado, se limita la riqueza de una lengua (o de una jerga) evitando la ambigüedad de forma que se pueda automatizar su traducción, ya sea mediante traducción completamente automática o mediante traducción basada en ejemplos o EBMT, que últimamente se está vendiendo con el maravilloso término de marketing "aprovechamiento de subsegmentos".

La preedición de documentos, al igual que el CTE, no sólo mejora la salida del motor y reduce la necesidad de postedición, sino que también mejora la precisión y calidad del documento origen.

* Sí, acabo de inventarme un término del todo innecesario. Lo mismo hicieron con la postedición y nadie se queja.

No hay comentarios:

Publicar un comentario en la entrada