Google: un moteur de recherche au profit d'une entreprise

Google Incorporation tire ses profits des clics effectués sur les annonces publicitaires qui conditionnent les critères de son moteur de recherche.

Fondée le 4 septembre 1998, Google Incorporation est une entreprise née de la thèse doctorale de deux étudiants en sciences informatiques de l'université de Stanford aux Etats-Unis, Larry Page et Sergey Brin, coordinés et asssistés techniquement par le Mexicain Hector Garcia Molina, alors directeur des laboratoires informatiques de la même université.

Un moteur de recherche programmé pour favoriser la vente d'espaces publicitaires

Le principal produit de Google Incorporation est le moteur de recherche du même nom, Google. Devenu le plus populaire des moteurs pour naviguer sur Internet, il est capable d'afficher en moins d'une seconde le résultat d'une recherche qu'il effectue simultanément dans les 40 premiers reds associés aux mots-clefs, satisfaisant son utilisateur dans plus de 70% des cas selon une enquête de la revue Quo*. D'après la même revue, chacun des centres de base de données de Google peut occuper 150 000 mètres carrés et s'estimer à 600 millions de dollars, fruit du succès commercial de Google. Comment concilie-t-il le traitement de l'information avec ses finalités commerciales?

Comment Google évalue-t-il la "pertinence" des informations entrantes?

A l'aide de plus de 10 000 détecteurs dits de qualité, Google classifie tous les liens possibles entre un nouveau contenu et ce qui est déjà présent sur la web. Un contenu est estimé pertinent lorsque sa probabilité de mobiliser l'intérêt des utilisateurs, en fonction du nombre de ses liens potentiels, est importante. Ceci n'a évidemment rien à voir avec sa pertinence intrinsèque pour le lecteur, ni avec l'intérêt qu'il peut susciter, et encore moins avec sa qualité.

Comment Google influence-t-il les recherches?

Dès la saisie des premières lettres, le moteur de Google s'active en suggérant les mots les plus recherchés pour compléter ce qui est en train d'être capturé. Il utilise des synonymes et mots similaires pour améliorer la recherche. Se crée alors une liste de résultats initiale ou provisoire, peu ciblée. Des millions de résultats sont alors disponibles, mais seulement 1000 ou moins s'affichent, sans que les critères de sélection ne soient précis.

La proximité géographique des centres d'achat promus sur les pages orientent Google

La localisation des webs régionales est en effet décisive dans cette phase du processus de la recherche, et non pas les propriétés purement sémantiques du thème traité. Google favorise la proximité entre l'internaute qui cherche et la source de l'information dans une même zone géographique, à des fins de rentabilité commerciale des annonces qui accompagnent ses résultats.

Définition des contenus "intéressants" par Google

Le programme Page Rank ordonne par classe d'intérêt les 1000 premiers contenus sélectionnés selon ses critères et élimine ceux qui lui semblent redondants. Il cherche les réponses en fonction des mots, du lieu et du type d'utilisateur. Si les termes ne couvrent pas un volume suffisant de recherches effectuées par l'ensemble des internautes sur Google ou que les annonces publicitaires génèrent un nombre insuffisant de clics, contenus et publicités peuvent être désactivés. La classification d'intérêt de Page Rank est donc tributaire du nombre de clics engendrés par chacun des 1000 premiers contenus.

Google a sa logique d'enrichissement de l'information

Dans son mode de recherche dite universelle, c'est-à-dire celui de Google.com, si des résultats de livres, vidéos, dernières annonces ou autres semblent pertinents pour le moteur de recherche, ils viennent se mélanger avec le reste des données sensées correspondre au thème traité. Google personnalise aussi la recherche en prenant en compte les pages visitées récemment par son utilisateur, même lorsqu'elles n'ont pas grand-chose à voir avec le sujet. Cette surabondance d'informations, sous le prétexte de couvrir toutes les attentes possibles de l'utilisateur, enrichit chaque page de résultats d'une potentialité accrue de clics publicitaires.

Les filtres aléatoires de Google

Les sites qui contiennent une manipulation excessive de codes et de mots-clefs visant à attirer son robot de manière systématique et sans fondement, selon les critères de Google, s'éliminent de la liste des résultats. A l'inverse, en fonction du nombre de clics générés, les annonces les plus productives de Google passent au-dessus des autres et se hierarchisent ainsi; les articles informatifs qui intéressent les internautes suivent la même logique.

Il est donc difficile de prévoir si le nombre important de clics produits par un contenu amènera Google à le considérer comme trafiqué -puis à l'éliminer- ou au contraire comme productif - et donc à le promouvoir.

La bonne réputation chez Google

L'interconnectivité locale de la liste des résultats prend en compte la "bonne réputation" des pages web par pays dont Google améliore la position dans la hiérarchie de ses réponses. Or Google suit la logique des tendances de recherche: si plusieurs utilisateurs de la même zone cherchent fréquemment le même contenu, Google prime son actualité en défavorisant d'autres critères. Ce contenu, quel qu'il soit, acquiert ainsi une "bonne réputation" en termes de rentabilité informatique.

De la bonne réputation à la profusion commerciale

Plusieurs pages du même domaine, classifié comme domaine de bonne réputation, peuvent alors s'afficher ensemble si chacune contient par elle-même suffisamment de notions différentes selon les critères propres que Google possède pour en décider. En règle générale, ce sont les publicités qui diffèrent, tandis que l'utilisateur se fatigue à relire la même chose de page en page avant de trouver, peut-être, une réponse pertinente à ce qu'il cherche.

*aux éditions Expansión, S.A. de C.V. Y Hachette Flipacchi Media Group (HFM), Mexico Districto Federal,

n°161, mars 2011, pages 24-25.

Sur le même sujet