miércoles, 25 de abril de 2012

Fuera Academia, dentro la masa: ¿qué puede salir mal?

Llevo un mes con ganas de comentar una noticia que parece haber pasado desapercibida en la blogosfera traductoril y correctora. Prefería que hablara de ello alguien con más conocimiento, pero al final tendrá que hablar un niñato sobre el tema.

Hace un mes Google actualizó el corrector ortográfico inglés de su paquete ofimático Google Docs. Ahora ya no se basa en un diccionario estático y con actualizaciones puntuales (ya sea comunitario como Hunspell/OpenOffice o formal como MS Office), sino que aprende de las búsquedas de los usuarios y de los textos que encuentra al peinar internet. Si se escriben y se buscan ciertos términos, esos términos se añaden al diccionario. Y, ya que está, aprende a relacionar unos términos con otros cercanos, algo que ha aprendido a hacer con los modelos lingüísticos construidos para Google Translate y con las autocorrecciones de búsqueda. En Google se aprovecha todo, como con el cerdo.

Foto CC-BY 2 de Paul Lowry

Vamos, es una mezcla entre corrector ortográfico y gramatical, solo que inteligente y con aprendizaje automático. Un Skynet de la lengua. Se puede decir que el corrector aprende de nosotros, que le damos de comer. Como con Google Translate, que confunde Amsterdam con Londres o Samsung con Motorola o la lía parda con el japonés. O como Google Search, que Bush es un fracasado miserable y que en la SGAE son unos ladrones. Pues va listo si se fía de los humanos, que nos equivocamos o intentar engañarle.

Mi bro Miguel Llorens comentaba que la importancia de una buena ortografía y gramática es relativa y también que a veces es mejor no ser tan académico y aceptar lo que quiere la mayoría. Al fin y al cabo, ¿te pagan las facturas tus clientes o la RAE/Fundéu? Claro que también está la responsabilidad del traductor (creación de neologismos o adopción de barbarismos) de la que ha hablado a veces Xosé Castro: ¿correo electrónico o e-mail? Hay que encontrar un término medio entre contentar al cliente y no pegarle demasiadas patadas a la lengua. Yo tengo uno (de electrónica profesional) que quiere que ponga compás en lugar de brújula, por ejemplo.

Pero no nos olvidemos de que no todos tenemos el mismo trasfondo y las mismas opiniones. Por ejemplo, a Eva y a Yeyu les patea leer "soporte técnico", dicen que tiene que ser "asistencia técnica". Para mí, la asistencia técnica es solo una parte del soporte técnico. Personalmente, intento respetar lo que me diga Fundéu siempre que no me parezca demasiado papista (marketing, en redonda y sin acento, por favor) o contradiga los deseos del cliente.

Pero me desvío del asunto, que esto no va de corrección, sino de normalización o aceptación. Recientemente a la RAE le han empezado a llover críticas: que si sexista, que si tacaña, que si chanchullera. La RAE no es una empresa pública, la subvencionan desde empresas privadas a comunidades autónomas. Creo que la Fundéu hace mejor trabajo, con rapidez, precisión y modernidad. La financian no solo BBVA y la Agencia EFE, sino también empresas privadas que van desde Hermes a Telecinco. En la Fundéu hay orden y eso se nota en la calidad de sus recursos.

Y luego está el corrector de Google, al que no le hace falta saber nada de corrección lingüística, simplemente escuchar lo que dice internet y aprender. Al fin y al cabo, mil millones de moscas no pueden equivocarse, ¿no? Pero no, no puedo ser tan demagogo: creo que el corrector inteligente ayudará más de lo que molestará. Vamos, tendrá una relación señal-ruido positiva, como Google Translate o la autocorrección de Google Search. Al igual que Fundéu, es solo una herramienta, útil en manos de profesionales, potencialmente terrible en manos de lusers. ¿Y qué mejor que un traductor que sepa manejar bien su herramienta?

31 comentarios:

  1. Completamente de acuerdo con tu opinión sobre Fundéu. Yo opino lo mismo, y creo que es el hijo punki, rojo, republicano, ateo y modernista de la RAE. ¿Qué digo hijo? Es el hermano pequeño. O el nieto del abuelo carca y cebolleta. Y como ya le dije a Leon en su última entrada, se aprende más de los jóvenes, de los hijos, de los hermanos pequeños, que de los mayores, y si el mundo se dedicase más a observar a los que tienen por debajo, el mundo sería ligeramente mejor.

    ResponderEliminar
    Respuestas
    1. Bueno, para mí Fundéu es modernA comparado con la RAE, pero sobre todo por su rapidez, cercanía y formas de diseminar información. En el fondo, en las recomendaciones, no son muy radicales, porque siguen las recomendaciones de la RAE siempre que existan y sean claras.

      Eliminar
  2. ¿Compás en vez de brújula? Eso ya no es una mera cuestión de corrección, precisión o preferencia lingüística, sino de inducir a confusión designando una cosa con el nombre de otra. Ya me imagino al pobre lector intentando localizar el norte con un compás de dibujar circunferencias.

    Por lo demás, estoy de acuerdo contigo en dos de las cosas que has dicho: creo que la Fundéu desempeña un papel mejor que la RAE como asesora en cuestiones de lengua española y que lo ideal es encontrar el equilibrio, el punto medio, entre la corrección lingüística/la preservación de la lengua y los deseos de los clientes/los conocimientos y las expectativas de los lectores.

    Un saludo,
    Isabel

    ResponderEliminar
    Respuestas
    1. Ya ves, el cliente siempre tiene la razón. Incluso cuando está diciendo la tontería más grande del mundo. Si un cliente insiste en poner blanco por negro y 2+2=5, le digo que eso no puede ser, pero me guardo confirmación escrita de la barbaridad y tiro p'alante.

      En el equilibrio está la virtud, sí.

      Eliminar
  3. Hola, Jordi: pues, creo que pueden salir mal muchas cosas. Algunos de los ejemplos que has dado, son precisamente producto de permitir las entradas a las masas(alias Google Bombing)

    El resto, suelen ser fruto de una compartición indiscriminada de las memorias de Google Translate, adaptadas a criterios o necesidades individuales, sin pensar en las consecuencias de compartirlas, o que han sido compartidas, simplemente, con ganas de [...].

    En cuanto al mejor desempeño lingüístico de la Fundéu, me parece una consecuencia lógica previsible. Quien tiene el dinero (BBVA), tiene la independencia financiera. Por el contrario, la RAE es una empresa económicamente dependiente de unas entidades (denominadas con el eufemismo de «patrocinadores») que tienen unos intereses económicos muy peculiares y a las cuales les interesa la manipulación lingüística. Ya lo predijo George Orwell en su novela 1984 con su teoría sobre la «Unilengua» y el «Pensamiento Único», no tan alejada de la realidad actual.

    Lo coherente, a mi modo de ver, es lo que comenta Isabel: mantenerse lo más equidistante posible de todos los componentes que influyen en el lenguaje y, para un servidor, esto incluye también los criterios de las masas. Mil millones de moscas, sí pueden estar equivocadas.

    ResponderEliminar
    Respuestas
    1. En el caso de Google Translate, incluye un sistema de valoración para escoger opciones más apropiadas e informar de fallos. Por supuesto, siempre puede haber gente que se dedique al ludismo / troleo, pero el sistema de mejora está ahí. Los fallos graves / graciosos que reciben publicidad en blogs también suelen corregirlos con rapidez.
      Pero sí, el nuevo corrector ortográfico del inglés en GDocs parece ser una caja negra que no permite mejora. El mayor peligro que veo es que se cuelen demasiados falsos positivos, como pasa a veces con la autocorrección en las búsquedas.

      Eliminar
    2. Ah, se me olvidaba. No conozco a fondo el sistema de financiación de la RAE comparado con el de Fundéu. Supongo que en Fundéu la mayor parte de los ingresos vienen de BBVA (y una pequeña parte del resto de patrocinadores), mientras que en la RAE los ingresos están mal repartidos. Y creo que las entidades públicas (CC. AA. y ayuntamientos) no deberían financiar la RAE si luego esta se pone tonta con los que reutilizan sus datos y presentan mejores interfaces.

      Eliminar
  4. Amén a todo hermano.

    Creo que la RAE está destinada a jugar un papel cada vez menor en la normalización de la lengua. Han apostado a sacar beneficios dentro del sector editorial (cambios normativos cada tres por cuatro para sacar diccionarios y gramáticas y venderlas a peso de oro) y a jugar la baza del panhispanismo, que me parece muy bonita y muy chula, aunque en la práctica creo que es una partida que van a perder. Si pretenden ser la voz autorizada en materia de español en los dos océanos, creo que van de culo. La RAE debería dedicarse a cumplir su función original: recoger el uso (algo que nunca han hecho, porque se han basado siempre en un uso culto, de las gentes de bien, y no de la lengua que se habla en la calle). Al no hacerlo, luego tienes barbaridades como las de los "gais" o similares. Mientras no se decidan a modernizarse (y eso incluye sustituir un más que discutible mecanismo de elección de miembros, donde pinta lo mismo un catedrático de lingüística que un periodista), pintan bastos.

    ResponderEliminar
    Respuestas
    1. Sí, esto de las Reales Academias me parece todo muy decimonónico, casi propio de la Ilustración. Ya espabilarán o quedarán obsoletos (más todavía).

      Eliminar
  5. Pues tienes razón en que había pasado desapercibido, al menos yo no ni había enterando.

    Estoy muy de acuerdo con lo que dices de seguir a rajatabla a unos u otros, al final lo mejor es encontrar el justo medio, que no siempre tiene que ser normativo y tampoco deberíamos escandalizarnos por ello. Algo no es más correcto porque todo el mundo lo use.

    He estado probando un poco la corrección y sí que se traga todo sí: me ha corregido visualsubsyn por visualsubsync —¡bien!—, pero no detecta nada incorrecto en "Its been awhile".

    ¡Saludos!

    ResponderEliminar
    Respuestas
    1. Interesante lo que comentas. Parece que tira más de lo aprendido con la autocorrección de Search que de los modelos de Translate.

      Eliminar
  6. Fundéu BIEN, la RAE... cuando empiecen a modernizarse (si lo hacen) veremos, pero están tan anquilosados en el pasado, con su vaso de GÜISQUI, que muchas veces obedecerles es crear un texto tan artificial como molesto a la vista.

    Esperemos que esta nueva herramienta ayude más que el corrector de Word, que justo acaba de cambiarme reescribir por rescribir. ¡Dónde se ha visto!

    ResponderEliminar
    Respuestas
    1. Espero que algo ayude cuando llegue al español, sí, aunque sea para que no te marque como errores todos esos nombres propios que tanto disgustan a Word.

      Eliminar
  7. Yo soy otra de las que no se habían enterado. Bueno, miento, algo había leído muy de pasada... pero tan de pasada, que como si no lo hubiera visto.

    Tienes razón, me repatea lo de "soporte técnico", aunque al final de tanto usarlo una se acaba acostumbrando xD. Cuando tienes un cliente que te hace cambiar "matriz" por "arreglo" (array) porque dice que "en español no se dice matriz" (en español de Latinoamérica no, pero en España sí), y cuando el corrector de otro cliente te hace cambiar "correo electrónico" por "e-mail" (tal cual, con guión y todo) porque según él "en España no se usa 'correo electrónico'" (WTF??!), pues al final terminas cogiendo el bote de vaselina y "pa'lante". Ahora bien, cuando nos llega un cliente que quiere usar términos que inducen a confusión (como el que comentas de compás/brújula), intentamos hacerle ver primero por todos los medios que es una cagada como una catedral por el motivo que dice Isabel. ¿Que sigue en sus trece? Pues nada, vaselina al canto.

    En cuanto al debate RAE vs. Fundéu: yo, siempre que puedo, me escudo en la Fundéu. Claro que utilizo a ambas a mi antojo para respaldar mis decisiones según mis preferencias o en función del cliente con el que me toque pelear :P. Y lo de la herramienta de corrección de Google, pues con lo que comentas no me termina de convencerme y además estoy con lo que comenta Pablo: si hay un millón de personas que escriben "Haber si nos vemos" y quinientas mil que escriben "A ver si nos vemos" (por ejemplo), pues ahí la estadística se columpia de lo lindo, así que lo siento, pero conmigo no cuela. Y añado que a mí Google últimamente me da miedo con tanto control y tanta ansia de querer abarcar todos los terrenos: me veo que dentro de poco tendré también un ambientador Google en el cuarto de baño que se alimentará de las preferencias aromáticas de los usuarios de la casa en función de la colonia o el desodorante que utilicen para encontrar la fusión de olores perfecta para todos sus habitantes...

    ResponderEliminar
    Respuestas
    1. Reconozco que sí había oído "array" en español, pero "arreglo" no. Los comerciales del país de turno que van de enteradillos son lo peor, se indignan y ven fallos donde no los hay. Hay que llevarlos con mucho tacto. Pero bueno, ellos sabrán cuál es la mejor forma de vender su producto.

      No sé cómo aprenderá el nuevo corrector de GDocs, pero espero que se le puedan poner excepciones a mano, como ya hacen con Translate. Vamos, que si mucha gente le da a "Ignorar" cuando sugiera "haber si nos vemos", que se dé cuenta de que es una corrección mal hecha. Creo que quien se molesta en pasar el corrector bien, sabe lo que hace, con lo que por ahí igual consiguen mejorar.

      Sí, Google es Skynet total y tiene el "Assimilate! Assimilate!" subidísimo. Pero bueno, suele acertar.

      Eliminar
  8. No uso Google Docs, así que creo que las anécdotas de aciertos o errores de la nueva herramienta me llegarán por terceros. Igual que Google Translate, el proyecto a la vez me pica la curiosidad y me suscita dudas sobre la automatización de un proceso que uno se había acostumbrado a dejar al criterio humano. El primer problema que se me ocurre es cómo manejará la multiplicidad de formas de deletrear ciertas palabras y cómo distinguirá entre lo que es una mala grafía y un neologismo. De antemano, imagino que surgirá un montón de ejemplos novedosos del “efecto Cupertino” (, que no tiene nada que ver con Apple sino que se refiere a la sustitución automática de la palabra cooperation por Cupertino debido a que el diccionario del revisor solo tenía la versión de la palabra con guion (co-operation). Mi actitud es que la sugerencia normativa, venga de Fundéu o (ahora) de los programas de revisión de Google, tiene que ser objeto de análisis crítico por parte del traductor profesional y no de acatamiento sumiso. Tomemos lo útil y cuestionemos lo inútil, porque en materia de lenguaje no hay aciertos o desaciertos tan tajantes como en la ciencia.

    ResponderEliminar
    Respuestas
    1. Espero que solo añadan al diccionario las palabras que sepan seguro que están mal y que sugieran lo más probable. Obviamente, no aprobando palabras y reglas de forma manual, sino otorgándoles un porcentaje de acierto. Mejor no sugerir nada que sugerir mal, creo yo. Ya veremos qué hacen.

      En cualquier caso, dependerá de que cada traductor sepa manejar bien su herramienta. Ah, y no me puedo creer que nadie haya comentado la gracia de "manejar bien su herramienta". Yo me reí cuando me salió sin querer.

      Eliminar
    2. Un caballero nunca comenta sobre el manejo de la herramienta de otro. Jejeje.

      Eliminar
  9. Gracias por compartir este "desahogo", Jordi. Yo también trabajo en tecnologías del lenguaje, en concreto, soy responsable de Lingüística de STILUS: sistema de «verificación automática de texto» (para el común de los mortales: «corrección automática»). Efectivamente, en Daedalus (empresa española creadora de dicha tecnología) tratamos de ajustarnos a la fórmula: corrección normativa + necesidades particulares del usuario + flexibilidad. Creemos que es la fórmula más útil y sensata. No en vano, entre nuestros grandes clientes contamos ya con el Grupo PRISA (editor del diario EL PAÍS), Unidad Editorial (editor de los diarios El Mundo, Expansión y Marca) o el Instituto Cervantes. Así que, aunque por supuesto siempre hay aspectos que mejorar en cobertura y precisión lingüísticas, también hay buena tecnología de revisión automática EN ESPAÑOL, aunque todavía no sea demasiado conocida.

    Encantada de leerte. Un saludo,
    Concepción Polo

    ResponderEliminar
    Respuestas
    1. Me suena haber visto algún corrector automático por ahí, pero, por lo que me ha parecido entender por vuestra web, STILUS todavía requiere intervención humana, ¿no? Es lo suyo, claro, por muy lista que sea la máquina, no se le puede dejar sola para decidir.

      De todas formas, no creo que vuestro producto se parezca mucho a lo que ofrece Google en inglés. STILUS requiere mucho trabajo de curación, seleccionando los recursos pertinentes y aplicándolos con los errores. Google aprovecha toda la potencia de la web para decidir qué es lo correcto, con lo que el margen de error a priori es mucho mayor y la consistencia, menor. Ahí le sacáis ventaja, aunque no en la corrección de nombres propios.

      P. D.: Es un poco molesto que no se pueda parar la animación de la portada de vuestra web. Lo suyo es que se detenga dándole a una de las bolitas de diapositiva para poder leer bien.

      Eliminar
  10. No podría estar más de acuerdo contigo. Y como dijo Concepción: «Gracias por compartir este "desahogo", Jordi».

    ResponderEliminar
  11. Jordi, interesante entrada, y con una información que está bien que conozcamos.

    Por un lado me hace gracia el espíritu tan poco normativo que subyace a una decisión así, que es reflejo de aquello tan cierto de que la lengua es de sus hablantes. Sin embargo, lo veo también problemático visto lo mal que se está escribiendo en general en internet y lo dictadores que solemos ser traductores y correctores, así que mejor concluyo simplemente que está bien que lo sepamos: que conozcamos la herramienta, como dices, para andarnos con mil ojos en caso de duda. Sobre todo para cuando esto llegue a aplicarse también para el español.

    ResponderEliminar
    Respuestas
    1. En internet se habla… iba a decir muy mal, pero quizá sea habla igual de mal que en la calle. Eso sí, hay webs que son verdaderos campos de minas y que Google debería añadir a una lista negra para no tenerlas en cuenta. Se me ocurren Yahoo! Preguntas y la gran mayoría de foros, por ejemplo.

      Pero bueno, Google Search ya prima a las webs que no tienen errores ortográficos, con lo que igual pueden reaprovechar esa tecnología para saber qué webs son más o menos válidas para que aprenda su corrector inteligente. Sería muy interesante saber cómo funciona el nuevo corrector de Google por dentro, pero supongo que es un poco secreto de estado.

      Eliminar
  12. La verdad es que me cuesta entender que se intente lapidar tanto la evolución de la lengua, en Italia viven con miles de dialectos y no tienen tantos problemas ni temen la disolución del idioma. Me parece forzado el uso excesivo de "en línea" en lugar de "online" o de correo electrónico en vez de "e-mail". Incluso me parecen curiosas las voces inglesas que recoge el diccionario, como diciendo: bueno, os admitimos en el grupo, pero sois cursivas, ¿eh? que el cartelito de redondas solo lo tenemos nosotras.

    Aun así, lo de Google me parece bien en parte, al final será muy útil para ciertas expresiones y maneras de hablar de la gente que "la norma" no recoge, sobre todo en el lenguaje que se va creando día a día y en las modas (por poner un ejemplo, el fenómeno de los memes). Estaría genial que esto se hiciera de una manera controlada para poder estar al tanto de estas formas de las que hablo sin que todo se diera categóricamente por bueno, claro está.

    En cualquier caso, el otro día usando el traductor de Google me pareció curioso que poniendo una frase del tipo "Receiving Party's obligations under this Agreement do not extend to information that is: (a) publicly known [...]" supiera establecer que "under" en ese caso se traduce por "en virtud de". Esto significa que quizá y solo quizá según las palabras puede incluir el texto dentro de un ámbito determinado y dar una traducción aproximada, que si bien puede que no sirva a nivel profesional como traducción, peligra el eterno dilema de la revisión de las traducciones automáticas.

    ¡Siento el rollo y gracias por despertar curiosidades y reflexiones!

    ¡Abrazos!

    ResponderEliminar
    Respuestas
    1. El caso del italiano me parece un tanto extremo. Por lo que tengo entendido, allí no les gusta traducir los neologismos, ni siquiera adaptarlos. La grandísima mayoría de términos de las TIC se toman prestados tal cual. Se pasan.

      Por lo demás, totalmente de acuerdo con "online" y "email". Igualmente, prefiero decir "ebooks" en lugar de "libros electrónicos", por simple economía lingüística. Lo mismo va para la cursiva para extranjerismos, cuando están muy extendidos no la veo necesario.

      Sí, lo suyo sería que Google controle (con humanos) qué entra en el nuevo corrector, pero no sería práctico y menos conociendo cómo le gusta prescindir de mano de obra humana para tareas "rutinarias". Supongo que asignarán un porcentaje de acierto a las correcciones y solo entrarán las que tengan uno alto.

      Sí, lo bueno de Google Translate es que tiene muy en cuenta el contexto, sobre todo cuando se usa una puntuación correcta. Aprende de ejemplos similares, de ahí que dé el pego.

      Eliminar
  13. Muy curioso, Jordi, yo tampoco me había enterado del cambio y bueno es saberlo.
    Me ha gustado mucho tu frase sobre que "en Google se aprovecha todo, como en el cerdo". Pero si tuviese que comparar el contenido de un cerdo enterito con el contenido escrito de toda la Red... Me da a mí que el segundo no es ortográficamente tan aprovechable como culinariamente lo es el primero. En fin, que yo sí creo que hay bastantes cosas que pueden salir mal, aunque claro está que es imposible saber hasta qué punto sin conocer a fondo el funcionamiento del sistema. Y por cierto, ¿sabes si este corrector es el mismo que ofrece Gmail?
    ¡Saludos!

    ResponderEliminar
    Respuestas
    1. Lo acabo de probar y el nuevo corrector del inglés todavía no está activado ni en Gmail ni en Chrome en general.

      A lo que me refería con la gracia del cerdo no es a internet, sino a los distintos servicios de Google. Por ejemplo, si para Search desarrollan un autocorrector basado en la web, ese autocorrector lo reciclan para Docs. O si desarrollan un sistema de edición compartida instantánea para Wave, lo reciclan en Docs, aumentando la velocidad de actualización de los cambios. O si desarrollan un sistema de reconocimiento de voz para búsqueda desde el móvil y un sistema de sintetización de voz para mejorar la accesibilidad para ciegos, mezclan estas dos tecnologías y tienes un app de Translate que escucha lo que dices en un idioma y lee su traducción en voz alta. Vamos, que aprovechan las sinergias entre departamentos en lugar de reinventar la rueda. Claro está, estos cambios no son inmediatos, de ahí que el nuevo corrector todavía no esté en GMail ni en Chrome. Ya llegará si lo consideran suficientemente bueno.

      Eliminar
  14. Las diferencias entre RAE y Fundéu son mucho menores de lo que parece. Aquí lo contamos, con pelos y señales: http://addenda-et-corrigenda.blogspot.com/2012/05/fundeu-bbva-el-largo-brazo-de-la-rae-en.html

    ResponderEliminar
    Respuestas
    1. El Dardo en la Academia me había llamado la atención, pero tenía pinta de ser demasiado formal. Gracias por el enlace, me he pasado el extracto al Kindle para leerlo con calma y ver si me interesa el libro.

      Eliminar
    2. No sé a qué te refieres con "formal"; pero, si estás en Medtrad, allí Fernando Navarro improvisó una reseña donde comentaba que, entre otras cosas, es una obra muy amena.

      Eliminar