Tres naranjas en línea sobre un fondo de hule azul celeste. La de en medio está enmohecida.

La enmerdación de Google

En los testimonios del caso antimonopolio del gobierno federal de los EE. UU. contra Google están apareciendo perlas muy interesantes. Por ejemplo, esta: Google reescribe sobre la marcha las consultas que recibe para que generen la máxima ganancia posible para la compañía, sin alterar el sentido de la búsqueda… demasiado.

Un ejemplo: si busco «AOVE beneficios», por la primera pantalla de búsqueda (en mi primera pantalla, a vosotros os pueden aparecer resultados distintos) desfilan tres vendedores diferentes de aceite de oliva con páginas que, siendo adecuadas para la búsqueda, tienen como objetivo prioritario vender su producto.

Quizá yo hubiera preferido obtener resultados más neutrales, si es que tal cosa es posible cuando hablamos del proceloso mundo de los nutricionistas. Pero Google me lleva a sitios que, sin duda, tienen importantes campañas de Google Ads activas.

Es importante notar en qué se diferencia esto de una aplicación directa del algoritmo PageRank™: sería perfectamente posible que, mediante técnicas SEO (acrónimo de Search Engine Optimization, optimización de buscadores) más o menos éticas, las páginas que me devuelve Google fueran las más relevantes según la puntuación de su algoritmo. Sin embargo, lo que sucede aquí implica un paso previo: la evaluación, sobre la marcha, de un conjunto de consultas similares a la original. La consulta a la que finalmente se responde, y sobre cuyos resultados se aplica el algoritmo PageRank™, es precisamente aquella que contiene las palabras clave por las que Google haya obtenido un mayor precio, dada una consulta con mi información demográfica de usuario asociada.

Esta técnica es indetectable para el usuario del motor de búsqueda, que recibe sistemáticamente respuestas «apropiadas», aunque quizá no «las más apropiadas». Como PageRank™ también es secreto, no podemos saber qué debería haber contestado el buscador.

Gráfico de porcentaje de consultas realizadas por diferentes buscadores de internet. Google tiene, en todo el año pasado (de septiembre de 2022 a septiembre de 2023) alrededor del 91 % del mercado.
Imagen: StatCounter Global Stats

PageRank™ en sí ya supone un abuso inaceptable de posición dominante. El buscador de Google realiza el 91,58 % de las búsquedas del mundo y clasifica sus resultados según un algoritmo del que todo lo que se sabe tiene que deducirse de los consejos de la propia Google para optimizar la posición de una página en sus búsquedas. Si hacemos SEO ético, se pueden resumir en una sola frase: «publica contenido relevante».

Pero al obtener la mayor parte de sus ingresos por su programa de publicidad Google Ads, Google se convierte en juez y parte. Puede jugar con su propia definición de relevancia. ¿Va a ser menos significativa una búsqueda sobre «coches eléctricos» si le añado, de forma transparente al usuario, el término extra «Renault»? Total, nadie lo va a saber nunca. Y si mañana Tesla paga más por su marca en combinación con los términos «coches eléctricos», será su resultado el que aparezca antes.

¿Podemos hacer algo? Yo he instalado Qwant como buscador por defecto en Firefox. Probadlo.


Actualización del 07/10/2023

Wired ha retirado el articulo que enlazo en esta pieza, citando una «cuidadosa revisión» y «material relevante recibido tras su publicación», pero sin más explicaciones. Al parecer, la evidencia mostrada por Google en los testimonios del caso antimonopolio no concierne a los resultados orgánicos de la búsqueda, sino a los anuncios. La explicación de Google:

An opinion piece recently appeared stating that Google “just flat out deletes queries and replaces them with ones that monetize better.” We don’t. The piece contains serious inaccuracies about how Google Search works. The organic (IE: non-sponsored) results you see in Search are not affected by our ads systems.

In particular, the piece seems to misunderstand how keyword matching is related to showing relevant ads on Google Search.

Ad keyword matching is a long-standing and well-known process that is designed to connect people to relevant ads. Learn more here:
support.google.com/google-ad…

A separate process, which has nothing to do with ads, is used to match organic results to a query, as explained here:
google.com/search/howsearchw…
It’s no secret that Google Search looks beyond the specific words in a query to better understand their meaning, in order to show relevant organic results. This is a helpful process that we’ve written about many times:

google.com/search/howsearchw…
blog.google/products/search/…
blog.google/products/search/…

blog.google/products/search/…
This ensures that Google Search can better show people organic results and connect them to helpful resources. If you make a spelling mistake, or search for a term that’s not on a page but where the page has a close synonym, or if you aren’t even sure exactly how to search for something, our meaning matching systems help.

En resumen: la realidad es algo menos espectacular, pero no por ello menos preocupante. Google no ha confesado que modifica el componente orgánico de las búsquedas para ganar más dinero, pero las modifica. Su objetivo es «leer» la mente del usuario y ofrecerle lo que tenga «más sentido». Pero ¿no es eso en extremo paternalista? ¿Por qué se han retirado herramientas de búsqueda que permitían a un usuario avanzado afinar sus resultados, para sustituirlas por estos algoritmos opacos?

Podéis leer la nota de Wired en el enlace al artículo, y el artículo original aquí.


Nota original en el Mastodón de @brucknerite (podría haber sido borrada).