How to blog in more than one language

The Spanish blogosphere looks weak. But language is accidental, automatic translation is ubiquitous, and the relative importance of content creator language is shrinking day in day out. However, when considering translation issues like those illustrated in the last post, perhaps some human intervention is in order to bridge the gap between semantic worlds.

To assist in this task, I have prepared a Blogger widget that allows writing posts in more than one language, discriminating among them and enabling the reader a clear view of her preferred content. To the user, the scheme resembles somewhat server-side content negotiation, but in a DOM-manipulating, Web-two-dot-zeroish way.

Some usage notes:

  1. First of all, you have to add the widget to your blog. There is a button next to the language selection combo to do just that. Not in Blogger? No problemo. Just download the script langsupport.js, and deploy it to your favorite location (it can be included in your template code, or anywhere in the HTML of your pages with a <script> tag, it is not too heavy, moreso if you use JS Minifier on it). You should at least remove the sentence with the comment Only needed when code is running inside a Blogger widget to make it work successfully outside Blogger.
  2. If not hosted on Blogger, you should also provide an anchoring point for Javascript to know where to insert the language selector combo. It should look like this:
    <span id="__langSupport__"></span>
  3. Denote language dependant HTML content with the lang attribute, using ISO 639-1 language names (there is no obligation to do so; however, the default language feature will malfunction). For instance:
    <p lang="en">This paragraph is in English.</p>
    <p lang="es">Este párrafo está en español.</p>
  4. Enjoy!

Things to keep in mind:

  • Unmarked HTML elements (those without lang attribute) will be left untouched.
  • A tag marked with a language which is not currently displayed will hide all its contents, even if some inside tag is marked with the currently displayed language. To avoid trouble, do not nest tags with different lang attributes.
  • If there are no lang attributes in the document, the combo selector will not appear.
  • The first language selected depends on default system locale. Therefore, if there is not content in that language on the page, the default language is selected (English, or ‘en’); if there is no content marked as the default language, the first one available (in lexicographical order) is chosen.
  • Unfortunately, the browser’s preferred language configuration is not exposed to the Javascript engine, AFAIK, so that setting cannot influence the default language here (it is only used for content negotiation with specifically configured servers): the default operating system locale is used instead.
  • This has been tested with Firefox 2. Never mind if IE also groks it.

Traducción de traducciones

A ver qué os parece este texto:

[…] El país vecino, Canadá, tiene cantidad probablemente similar de brazos flojos y no pasan estas cosas. Si la gente no necesitara comprarlos, si ella dejara la dejarían ser los discusiones necesarios sobre ellos. […] El editorial del poste de Washington de hoy pide la cosa siguiente: ¿En qué circunstancias y donde comprado el pistolero sus brazos? ¿Habría experimentado la universidad la misma tragedia si la ley de Virginia prohibió los brazos en los campus? Debe tener detectores de brazos en los dormitorios y las salas de clase. […]

Está extraído de TheBlog (Ya le hemos puesto cara, 18/04/2007), pasado dos veces por el traductor de Google, la primera del español al inglés, y la segunda a la inversa. Una prueba casi matemática de que si A es un conjunto de palabras en un idioma L, y f una función de traducción automática de L a L’ (otro idioma), entonces f no es invertible. Es decir:

f(f-1(A)) ≠ A

Por álgebra elemental, esto significa que f no es biyectiva, y en lengua más común, que la transformación de un idioma en otro puede incurrir (e incurre, en cualquier caso no trivial) en pérdida de información. En un aparte, los detectores de brazos me parecen una gran idea, amén de sencillos de implementar: bastará instalar detectores de dedos, dividir por 5 y restar 2.

Los seres humanos traducimos con cierta fiabilidad porque tenemos sensibilidad al contexto. Es obvio para cualquiera con nivel medio de inglés que, en el texto del ejemplo, donde dice brazos debería decir armas. En este idioma, arms es polisémica, y por tanto, tan sólo el contexto puede dar pistas acerca de lo que significa realmente la palabra. La frase completa es una unidad de contexto insuficiente; el párrafo, el texto, todos los textos de una disciplina, son unidades que permitirán mayor precisión. ¿Y ya hay quien está persiguiendo este enfoque? Sí, claro que sí.

Hipertrofias del Javascript

Una consecuencia interesante de lo que se está dando en llamar Web 2.0 es que la interactividad que se espera de las páginas en la red comporta un engrosamiento de los componentes de apoyo. Es cierto que conforme los navegadores cumplen más y más con los estándares del W3C (pero podéis probar el test ACID2 para ver lo lejos que estáis) las páginas se transforman en aplicaciones.

El sueño del cliente ligero, que sólo requiere de un navegador para realizar cualquier tarea, está a punto de hacerse realidad. No sólo por los esfuerzos de Google por crear un nuevo monopolio (¿a que tiene gracia? Microsoft acusando a Google de monopolista…) Existen muchos jugadores que persiguen lo que unos anglófonos, en la más acendrada tradición de los padres del Mitsubishi Pajero y el Nissan Moco, han llamado WebOS (Web Operating System, claro). Sólo un par de ejemplos de entre lo más destacado: YouOS y eyeOS.

Sinceramente, me dan sudores fríos sólo con pensar en el código Javascript que hay detrás de esos ímprobos esfuerzos. Al navegador también, viendo los tiempos de respuesta de las “aplicaciones”. Me río de los applets. Pero lo que más me llama la atención es la autorreferencia implícita en todo sistema operativo web: naturalmente, todos tienen un navegador. No importa que (obviamente) ya tengas uno. No me resisto a la tentación de abrir el navegador, visitar desde él la página del “sistema operativo”, abrir el navegador… It’s turtles all the way down.

Evidentemente, la utilidad principal de estos WebOS es la de servir como plataformas para quioscos en sitios públicos. La duda que me queda es si merecen la pena, existiendo distribuciones de Linux con gestores de ventanas perfectamente aptos para la tarea. En cualquier caso, parece una tendencia natural del Homo sapiens informaticus ampliar cualquier programa hasta que se transforma no ya en un cliente de correo electrónico, como afirma la tradición, sino en todo un sistema operativo.