Estándares (II)

Estándares abiertos y estándares propietarios
Aunque muchas herramientas de localización comerciales anuncian a bombo y platillo que son compatibles con estándares abiertos, da la impresión de que esta compatibilidad sea algo secundario a sus soluciones propietarias. Por ejemplo, la compatibilidad con TMX en las soluciones de SDL Trados ha sido muy incompleta hasta hace poco, con pérdida o corrupción de datos al convertir una memoria a TMX y después importarla de nuevo a una memoria. Por otra parte, un viaje de ida y vuelta (exportación e importación) usando el formato interno de memorias de Trados solía completarse sin errores.
Los desarrolladores de herramientas de localización prefieren sus propios estándares, ya que los controlan y pueden actualizarlos más fácilmente siempre que lo requieran en lugar de esperar a que un organismo independiente debata, implemente y apruebe los cambios a la especificación. Sin embargo, la aplicación de estándares propietarios por parte de los desarrolladores de herramientas desemboca en mantener al cliente prisionero de una solución o servicio, ya que éste se lo piensa dos veces antes de cambiar de proveedor por la posibilidad de pérdida o corrupción de metadatos en el proceso de migración.

Metadatos
La información almacenada en formatos de archivo se organiza y cataloga mediante los metadatos. Metadatos, como el mismo nombre indica, son datos que "hablan" sobre sí mismos. Por ejemplo, unos metadatos básicos especificarían el nombre del estándar, la revisión y la codificación del texto. Estos suelen aparecer en el encabezado de cualquier estándar compatible con XML. Según la información y los objetivos que persigue el estándar, otros metadatos pueden especificar el idioma, país y otras variaciones (locale) del archivo entero, de campos de texto específicos, etc. También puede especificar las fechas de creación y revisión de un campo, o el autor de cualquiera de éstos, algo especialmente útil en el control de versionado y en la automatización del mantenimiento. Otra información puede incluir comentarios, referencias a archivos externos o URIs (webs, carpetas en red), como bases de datos de terminología, memorias de traducción, reglas de segmentación de texto, traducciones de otros idiomas o frases similares, etc.

Usos de los metadatos
Los metadatos están especialmente destinados al filtrado y a la minería de datos. Por ejemplo, un proyecto de mantenimiento de memorias de traducción podría necesitar revisar todas las entradas creadas o modificadas por un editor específico. Un gestor de proyectos de traducción podría necesitar separar entradas en dos grupos: las que tienen un porcentaje alto de coincidencia (digamos del 90% en adelante) con la memoria de traducción (MT) y el resto. Ambas tareas no tienen mayor complicación, ya que estos metadatos están previstos en los estándares TMX y XLIFF. Aunque las herramientas de traducción empleadas no puedan realizar estas tareas por sí mismas, siempre podemos recurrir a escribir expresiones regulares de búsqueda y reemplazo para extraer o destacar los campos requeridos.

(Ésta es la segunda de mis entradas relacionadas con mi tesina del máster. Queda una más sobre estándares y ya cambio de tercio. Como veis, no valgo para investigador. Y no es falsa modestia.)

Comentarios

Entradas populares de este blog

La posedición: ¿zombificación del traductor?

Recuento ponderado WWC

Impacto de la subida de impuestos (IVA e IRPF) en traductores autónomos