Privacy concerns with Google Analytics

Les enjeux de la confidentialité de Google Analytics : Le problème est-il sérieux ?

Contents

Si vous vous êtes déjà interrogé sur le respect de votre vie privée lorsque vous utilisez Google Analytics, c’est probablement parce que vous avez déjà des doutes.

Et vous avez bien raison. Google Analytics (GA) est un outil d’analyse Web populaire, qui est loin d’être une référence en matière de respect de la vie privée des utilisateurs.

Dans cet article, nous vous expliquons les nombreuses préoccupations des utilisateurs, des consommateurs et des organismes de réglementation concernant la confidentialité de Google Analytics, exprimées au fil des ans.

Nous y aborderons les points suivants :

Quelles informations Google Analytics recueille-t-il sur les utilisateurs ?

Pour comprendre les problèmes que soulève Google Analytics en matière de respect de la vie privée, vous devez savoir comment Google traite les données des internautes.

Par défaut, le service recueille les informations suivantes :

  • Des statistiques de session : durée, page(s) consultée(s), etc.
  • Des informations sur le site Web source : le lien par lequel vous êtes arrivé ou le mot-clé utilisé.
  • La position approximative : le pays, la ville.
  • Des informations sur le navigateur et le périphérique : téléphone portable ou ordinateur de bureau, système d’exploitation utilisé, etc.

Google obtient des données d’analyse Web sur les utilisateurs de deux façons : un code de suivi Google Analytics sur site et des cookies.

Un cookie est un identifiant (ID) unique attribué à chaque utilisateur visitant une page Web. Chaque cookie mémorise deux éléments de données : l’identifiant unique de l’utilisateur et le nom du site Web.

Grâce aux cookies, les solutions d’analyse Web reconnaissent les visiteurs habituels et suivent leurs activités sur le ou les sites Web.

First-party vs third-party cookies
  • Les cookies primaires sont générés par un site Web et recueillent des données sur le comportement des utilisateurs provenant uniquement dudit site Web.
  • Les cookies tiers sont générés par un élément de site Web tiers (par exemple, une publicité) et permettent de suivre les données relatives au comportement de l’utilisateur sur plusieurs sites Web.

Comme il est facile de l’imaginer, les cookies tiers sont une mine d’or pour les sociétés vendant des publicités en ligne. Ils permettent en fait aux plateformes publicitaires de continuer à observer comment l’utilisateur navigue sur le Web après avoir cliqué sur un certain lien.

Or, les internautes ont peu idée des données qu’ils partagent et de l’utilisation qui en est faite. Par ailleurs, le consentement de l’utilisateur au suivi sur plusieurs sites Web n’est que très peu garanti par les contrôles existants de Google Analytics.

Les raisons pour lesquelles la collecte de données de cookies tiers par GA est problématique

Les cookies servent à transmettre des informations personnelles identifiables (IPI) telles que le nom, les données de connexion, l’adresse IP, le mode de paiement enregistré, etc. Certaines de ces informations risquent de se retrouver chez les annonceurs sans que les utilisateurs en aient directement connaissance ou qu’ils y consentent.

Des cadres réglementaires tels que le Règlement général sur la protection des données (RGPD) en Europe et la loi californienne sur la protection de la vie privée des consommateurs (CCPA) sont nés en réponse au suivi non contrôlé du comportement des utilisateurs.

Sous la pression réglementaire, les grandes entreprises du secteur des technologies de l’information ont dû adapter leur processus de collecte de données.

Apple a été le premier à mettre en œuvre le blocage par défaut des cookies tiers dans le navigateur Safari. Elle a ensuite ajouté un mécanisme de consentement au suivi pour les utilisateurs d’iPhone dès la version 15.2 d’iOS.

Google a également déclaré qu’il abandonnerait l’utilisation de cookies tiers après que la Commission européenne et l’autorité britannique de la concurrence et des marchés (CMA) ont lancé des enquêtes anticoncurrentielles sur son activité.

Pour échapper aux autorités de surveillance des données, Google a publié Privacy Sandbox, un ensemble de changements technologiques, opérationnels et de conformité progressifs visant à garantir davantage de respect de la vie privée des internautes.

La promesse la plus importante de Google ? Supprimer l’utilisation de cookies tiers pour tous les produits Web et mobiles.

Google avait initialement promis de supprimer les cookies tiers d’ici à 2022. Mais cette promesse n’a pas été tenue. Au lieu de cela, Google a retardé la fin des cookies de suivi pour Chrome jusqu’à la mi-2023.

Pour quelle raison ont-ils reporté cette décision malgré les lourdes amendes infligées par les régulateurs ?

Tout simplement parce que les publicités en ligne rapportent beaucoup d’argent à Google.

En 2021, Alphabet Inc (société mère de Google), a réalisé 256,7 milliards de dollars de revenus, dont 209,49 milliards de dollars provenaient de la vente de publicités.

Le manque de rigueur dans l’application des règles de confidentialité de Google Analytics – et son utilisation généralisée par les propriétaires de sites Web – permet à Google de gagner des milliards en recueillant et en vendant les données des utilisateurs.

Comment Google utilise les données Google Analytics collectées pour la publicité

Des codes de suivi Google Analytics sont installés sur plus de 28 millions de sites Web (soit environ 85 % d’Internet).

S’il est probable qu’un jour nous disposerons d’une version de Google Analytics sans cookies, cela ne répondra toujours pas à toutes les préoccupations des régulateurs et des consommateurs en matière de respect de la vie privée.

Au fil des ans, Google a accumulé une vaste collection de données sur les utilisateurs. Ces données ont été utilisées par les ingénieurs de l’entreprise pour élaborer des modèles d’apprentissage profond ultramodernes, désormais employés pour créer des profils d’utilisateurs avancés.

L’apprentissage profond est le processus qui consiste à entraîner une machine à reconnaître des modèles de données. Ces « connaissances » sont ensuite utilisées pour produire des prévisions très précises. Plus la quantité de données dont vous disposez pour entraîner le modèle est importante, plus sa précision future sera élevée.

Le géant Google a amassé de vastes ensembles de données issues de sa gamme de produits : notamment GA, YouTube, Gmail, Google Docs et Google Maps. La société utilise maintenant ces données pour élaborer un mécanisme alternatif sans cookies tiers permettant de modéliser les préférences, les habitudes, les modes de vie des gens, etc.

Leur dernier modèle s’appelle Google Topics.

Il fait suite à la tentative ratée de Google de remplacer l’apprentissage basé sur les cookies et son modèle FLoC (Federated Learning of Cohorts). Malheureusement, entre autres problèmes, la solution n’offrait pas suffisamment de transparence et de contrôle aux utilisateurs.

Google Topics
Source : Blog Google

Google Topics a pour ambition de limiter la granularité des données que les annonceurs obtiennent sur les utilisateurs.

Cependant, il s’agit toujours d’une méthode de surveillance des utilisateurs du Web. Avec Google Topics, l’entreprise continuera à collecter les données des utilisateurs via Chrome (et probablement d’autres produits Google) avec pour objectif de les partager avec les annonceurs.

En effet, comme nous l’avons déjà dit : Google a pour vocation de tirer profit des données des utilisateurs.

Les deux principales façons dont Google exploite les données de ses clients

Chaque bit de données que Google collecte à travers son écosystème de produits peut être utilisé de deux façons :

  • Pour cibler et personnaliser les annonces
  • Pour améliorer les produits de Google

La seconde permet également d’améliorer la première.

La personnalisation et le ciblage avancés des annonces

GA fournit à l’entreprise de nombreuses données concernant les éléments suivants des utilisateurs :

  • Les recherches récentes et fréquentes
  • L’historique de localisation
  • Les sites Web visités
  • Les applications utilisées
  • Les vidéos et les publicités visionnées
  • Les données personnelles comme l’âge ou le sexe

La politique de confidentialité de l’entreprise le stipule explicitement :

Google Analytics Privacy Policy
Source : Google

Google admet également utiliser les données collectées pour « évaluer l’efficacité des publicités » et « personnaliser le contenu et les annonces que vous voyez sur Google ».

Mais il n’est précisé nulle part comment les données des internautes sont utilisées et comment empêcher qu’elles soient partagées avec des tiers.

Dans certains cas, Google « oublie » également d’informer les utilisateurs de son suivi au sein des produits.

Des journalistes de CNBC et du New York Times ont conclu de manière indépendante que Google surveille l’activité des utilisateurs sur Gmail. En particulier, la société scanne votre boîte de réception à la recherche d’achats récents, de voyages, de vols et de notifications de factures.

Bien que Google affirme que ces informations ne sont pas vendues aux annonceurs (directement), ils peuvent néanmoins utiliser les « informations enregistrées sur vos commandes dans d’autres services Google ».

Là encore, il en découle que vous ne contrôlez ou ne connaissez que très peu l’utilisation ultérieure des données.

Améliorer la convivialité des produits

Google dispose de nombreux outils pour recueillir différents types de données, de l’historique de recherche de l’utilisateur aux itinéraires physiques fréquemment empruntés.

La société se réserve également le droit d’utiliser ces informations afin d’améliorer les produits existants.

Concrètement, cela signifie qu’en combinant différents types de données obtenus à partir de divers produits, Google est en mesure de dresser un portrait détaillé de la vie d’une personne. Même si de telles données de profil d’utilisateur sont anonymisées, elles restent d’une précision alarmante.

Douglas Schmidt, chercheur en informatique à l’université Vanderbilt, a bien résumé la situation :

« Le modèle économique [de Google] consiste à recueillir autant de données que possible sur vous et à les mettre en corrélation afin d’essayer de rapprocher votre personnalité en ligne de votre personnalité hors ligne. Ce suivi est indispensable à leur activité. Le terme ‘capitalisme de surveillance’ résume parfaitement la situation. »

L’obsession de Google pour la collecte de données est intégrée dans son modèle économique

Certes, mais Google propose-t-il aux utilisateurs des moyens de protéger leur vie privée ? Oui. Google ne voit et n’utilise que les informations que vous saisissez volontairement ou auxquelles vous lui permettez d’accéder.

Toutefois, comme le souligne le correspondant du Washington Post :

"Les grandes entreprises [du secteur des technologies de l'information] définissent toutes les règles, pour autant qu'elles les soumettent aux clients dans des conditions de service alambiquées que même ceux qui sont capables de décoder le langage juridique prennent rarement la peine de lire. D'autres mécanismes de notification et de consentement, tels que les clauses d'exclusion et d'adhésion, créent des problèmes similaires. Le contrôle pour le consommateur reste le plus souvent une illusion."

Google affirme ouvertement être « une des nombreuses régies publicitaires qui personnalisent les annonces en fonction de votre activité en ligne« .

Là où le bât blesse est que la société dispose de plus de données que toutes les autres régies publicitaires (sans doute combinées). Cela permet à Google de vendre un ciblage de haute précision et des annonces personnalisées en fonction du contexte moyennant des milliards de dollars par an.

Compte tenu du fait que Google a des intérêts dans un si grand nombre de produits, il est vraiment difficile de dé-Googler votre entreprise et de minimiser le suivi et la collecte de données de la société.

En outre, la société est en train de se tailler un monopole sur la collecte et la propriété des données. Cette réalité inquiète les régulateurs. L’enquête formelle en matière de pratiques anticoncurrentielles 2021 de la Commission européenne stipule ce qui suit :

"L'enquête formelle permettra notamment d'examiner si Google fausse la concurrence en limitant l'accès de tiers aux données des utilisateurs à des fins publicitaires sur des sites web et des applications, tout en réservant ces données pour son propre usage."

En d’autres termes : En exploitant les données des utilisateurs à son avantage déloyal, Google entrave apparemment la concurrence.

Toutefois, ce n’est pas le seul point qui inquiète les régulateurs et les internautes. Au fil des ans, Google a également fait l’objet à de multiples reprises d’autres poursuites pour atteinte à la vie privée des gens.

Ci-dessous, une chronologie :

Par ailleurs, Google a bien souvent du mal à respecter la conformité au RGPD.

Comment Google Analytics contribue au problème du respect de la vie privée sur le Web

Google Analytics est le principal rouage qui sous-tend le modèle économique de Google.

Si Google proposait une alternative à Google Analytics axée sur la confidentialité, la société perdrait l’accès aux précieuses données des internautes et une grande partie de ses revenus publicitaires numériques.

Pensez-y : Google collecte plus de données qu’il n’en partage avec les utilisateurs d’analyses Web et les annonceurs. En revanche, elle en conserve une grande partie pour un usage personnel et ne cesse de chercher des moyens de partager ces informations avec les annonceurs (d’une manière qui leur évite d’être inquiétés par les autorités de réglementation).

Pour rendre Google Analytics véritablement éthique et respectueux de la vie privée, Google devrait modifier l’intégralité de son modèle de revenus, ce qui est peu probable.

Qu’en est-il des utilisateurs de Google Analytics ?

Les voilà dans une impasse. Les entreprises qui utilisent GA se rendent ainsi complices des pratiques douteuses de Google en matière de collecte et d’utilisation des données. Elles deviennent une partie du problème.

En fait, l’utilisation de Google Analytics expose une entreprise à deux types de risques :

  • Que leur réputation en pâtisse. 77 % des internautes dans le monde entier déclarent que la transparence sur la manière dont les données sont collectées et utilisées est primordiale lorsqu’ils interagissent avec différentes marques. Pour cette raison, les atteintes à la protection des données et l’utilisation abusive des données par les marques entraînent des indignations publiques considérables sur les réseaux sociaux et parfois des boycottages.
  • Qu’ils soient poursuivis en justice. Les régulateurs de l’UE sont en croisade permanente contre Google Analytics 4 (GA4) car il enfreint le RGPD. Les autorités de surveillance françaises et autrichiennes ont jugé le « service » illégal. Puisque Google Analytics n’est pas conforme au RGPD, il expose toute entreprise qui l’utilise à des poursuites judiciaires (ce qui est déjà le cas).

Il existe toutefois une solution.

Choisissez une alternative à Google Analytics respectueuse de la vie privée

Google Analytics est un service d’analyse Web très répandu, mais ce n’est pas le seul disponible. Il existe des alternatives comme Matomo.

Notre ligne directrice est la suivante : le respect de la vie privée.

À la différence de Google Analytics, les utilisateurs conservent la pleine propriété de leurs données. Matomo vous permet de déployer des mécanismes de contrôle pour la collecte des données des utilisateurs, respectueux de la vie privée.

De plus, vous pouvez héberger vous-même Matomo On-Premise ou choisir Matomo Cloud dont les données sont stockées en toute sécurité dans l’UE et en conformité avec le RGPD.

Le plus beau dans tout ça ? Nous vous proposons d’essayer gratuitement notre alternative éthique à Google Analytics. Et ce, sans carte de crédit ! Commencez votre essai gratuit de 21 jours maintenant.

Enjoyed this post?
Join the 160,000+ subscribers who receive the Matomo Newsletter straight to their inbox every month
Get started with Matomo

A powerful web analytics platform that gives you and your business 100% data ownership and user privacy protection.

No credit card required.

Free forever.

Get started with Matomo

A powerful web analytics platform that gives you and your business 100% data ownership and user privacy protection.

No credit card required.

Free forever.