Cest quoi un tracker en informatique ?

Le « tracking » consiste à observer et collecter des données (généralement sur les personnes physiques dans le cadre des mécanismes publicitaires, mais pas uniquement) sans utiliser le moindre outil spécifique (qui serait alors une malveillance de type « spyware »), afin d'en tirer divers profils.

Les seuls « traqueurs » qui communiquent ouvertement sur le tracking, et tentent de justifier son usage massif, tentaculaire (au sens propre et figuré du terme), sont les régies publicitaires (liste), et ils sont diserts sur le sujet :

Le tracking est une forme d'espionnage à la RG (services secrets intérieurs français) qui cache son nom.

Tout ce que vous faites est surveillé, vous êtes observé, filé, suivi en permanence. Il existe :

« Tracker » et « tracking » sont des mots anglais.

Que contiennent les entêtes HTTP et qu'est-ce qui pose un problème

  • Que contiennent les entêtes HTTP et qu'est-ce qui pose un problème
  • Clickstream

Le tracking est une forme d'espionnage qui cache son nom. Il n'y a besoin d'aucun outil d'espionnage pour pratiquer cet espionnage. Les dispositions techniques natives de l'Internet et du Web le permettent. Elles comportent la transmission de nombreuses données, pour des raisons historiques de mise au point et dépannage du réseau Internet naissant. Dans ce fonctionnement client/serveur qu'est le Web, ces données partent du client, chez l'internaute, (par exemple le navigateur Web) vers les serveurs de tous les objets affichés (ou pas) sur chaque page Web visitée (ce peut être 20 ou 30 ou 40 serveurs pour une seule page Web).

Le tracking doit permettre à ses acteurs de construire, le plus complètement possible, l'inventaire des moindres faits et gestes de chacun dans le monde numérique (qui ne se limite pas au Web), quoi, où, quand, comment, afin de déterminer maintenant (temps réel) et dans le futur (prévision, temps long) à quel produit ou service marchand s'intéresse ou va s'intéresser chaque internaute du monde.

Par exemple, le tracking doit permettre construire les clickstream de chaque internaute du monde pour les analyser et en tirer des conclusions

Nota :
Pour certains observateurs, comme les gouvernements et leurs chevilles ouvrières d'espionnage et contre-espionnage, les analyses/conclusions porteront sur tout-à-fait autre chose que les besoins publicitaires. Par exemple les modifications de « personnalité » et « comportement », dans le temps, des cibles affectées.

Chaque serveur reçoit et stocke, indéfiniment, les informations transmises, d'une manière normale et naturelle, par les en-têtes des requêtes Http.

Le tracking sert les intérêts du monde de la publicité. Il s'agit toujours de l'adage :

Délivrer le bon message, à la bonne personne, au bon moment, par le bon canal.

Pour y arriver, il est nécessaire de savoir à chaque instant et partout (Web ou pas), ce que font chacun des individus au monde.

La publicité est le modèle économique du Web et il n'est pas question de totalement l'interdire/la bloquer sinon les sites Web disparaissent ou passent à un modèle économique payant (ce qui a déjà commencé dans la presse, les sites de « news », les sites de veilles, etc.).

Mais la vie privée est juste un concept, aux contours flous, certes, mais pourtant largement protégée par diverses lois, divers règlements et diverses jurisprudences. Un violent coup de poing a été peaufiné le 14 avril 2016 et assené le 25 mai 2018 ans ce marigot d'acteurs qui faisaient ce qu'ils voulaient, où ils voulaient, quant ils voulaient, comme ils voulaient. Le « RGPD » (Règlement Général sur la Protection des Données) – en anglais « GDPR » (General Data Protection Regulation).

Aucun spyware : il suffit d'utiliser le Web, sur l'Internet, et ses mécanismes standards :

Affichage de la page Web visitée : provoque une requête Http avec son en-tête http vers le serveur qui héberge la page Web visitée.

Nota :
Le site peut utiliser de nombreux serveurs si ses « objets » (on ne parle pas des objets « tiers ») sont sur plusieurs serveurs (serveurs de code html, serveurs d'images, serveurs de vidéo, serveurs de ressources son, serveur de CSS, serveur de scripts JavaScript, etc. ...), pour des raisons de vitesse (équilibre de la charge des serveurs appelée « load balancing » ) comme pour rendre très difficile une attaque en DDoS contre lui.

Cette page Web contient une foule d' « objets » qui ne proviennent pas du serveur du site Web visité mais de très nombreux autres serveurs :

Affichages publicitaires dont les contenus se trouvent sur des serveurs distants (ceux des régies publicitaires, on ne sait qui, on ne sait où) : provoquent des requêtes Http avec leurs en-têtes http

Nota :
Même si le webmaster ne travaille qu'avec une seule régie publicitaire, celle-ci peut sous-traiter ou fédérer des centaines de régies, donc des centaines de serveurs.

Boutons « J’aime » et tous les trucs similaires : provoque des requêtes Http avec leurs en-têtes Http

Boutons des réseaux sociaux : provoque des requêtes Http avec leurs en-têtes http. Pour chaque bouton (Google+, J'aime, FaceBook, Linkedin, Twitter, etc. ...), il y a un serveur derrière.

Scripts de statistiques (offerts gratuitement) pour webmasters : provoque des requêtes Http avec leurs en-têtes http.

Nota :
Les services de statistiques sont incrustés dans toutes les pages Web de tous les sites Web du monde, pour les besoins des Webmasters (ou pour flatter leur ego). Certains utilisent parfois plusieurs services de statistiques, donc plusieurs serveurs sont sollicités.

Scripts de communications, genre forums de discussion (offerts gratuitement) pour webmasters : provoque des requêtes Http avec leurs en-têtes Http

Divers services gratuits pour webmasters, normalement éparts, collectés par certains opérateurs sur des serveurs tentant ainsi de centraliser/cartelliser le Web et provoquant des centralisations de requêtes Http avec leurs en-têtes http

Nota :
Par exemple, Google a recopié sur ses serveurs les librairies géniales de scripts, développées par des particuliers à droite à gauche, que tous les Webmasters et les développeurs utilisent dans tous leurs sites : googleapis.com (ajax, jquery, etc. ...). Donc, même si vous fuyez Google, Google arrive à vous atteindre.

Production de ressources audio-vidéo dans des formats non standard obligeant à l'usage de lecteurs de média spécifiques, en ligne, provoquant des requêtes Http avec leurs en-têtes Http

Régies publicitaires sectorielles, dont pour adultes, permettant de profiler les visiteurs et provoquant des requêtes Http avec leurs en-têtes http

Champ de recherches internes dans un site. Ceci appelle un moteur de recherche externe. Mis à part les 3 ou 4 moteurs de recherche qui assurent protéger votre vie privée, tous les autres vous pistent et vous suivent à la trace.

Nota :
Le moteur de recherches internes de Google étant gratuit et très bien fait, tous les Webmasters l'utilisent, ce qui permet à Google d'atteindre, malgré eux, les internautes qui n'utiliseraient pas son moteur de recherche et tenteraient de fuir Google.
Assiste.com utilise le moteur QWANT (protection de la vie privée).

Scripts de commentaires sur les produits achetés, genre forums de discussion offerts gratuitement aux webmasters : provoque des requêtes Http avec leurs en-têtes Http et permettant aux opérateurs de ces services d'identifier des actes d'achats réel

Pour provoquer l'envoie d'une requête Http, avec son en-tête http, lorsqu'il n'y a pas de raison valable de le faire, il est fait appel à un substitut d'objet à aller chercher sur le serveur souhaitant faire du tracking : un Web Bug (une micro-image invisible d'un seul pixel, transparent).

Fabrication de GUID (identificateur unique permettant d'identifier/de retrouver un utilisateur unique sur tous les sites Web du monde qu'il visite)

Extraction de l'identificateur unique du navigateur (fingerprinting) - identificateur unique permettant d'identifier/de retrouver un utilisateur unique sur tous les sites Web du monde qu'il visite – l'outil Panopticlic, de la puissante et redoutée EFF (Electronic Frontier Fondation) permet de vérifier que, dans la quasi-totalité des cas, cette empreinte est toujours unique.

Etc.

A aucun moment il n'a été utilisé le moindre code (programme) pour pratiquer cet espionnage.

C'est quoi un tracker sur Internet ?

Un tracker est un dispositif technique permettant de mesurer les interactions des utilisateurs avec un site web ou tout autre forme de support électronique (par exemple des e-mails), ainsi que de collecter des informations sur ces utilisateurs et leur environnement au moment de la consultation d'une page.

Qu'est

Tracking est un mot anglais issu du verbe "to track", qui signifie "pister". Il s'agit d'une technique de marketing digital qui aide les entreprises à connaître le comportement des utilisateurs se trouvant sur leur site.

Comment fonctionne le tracking ?

La collecte s'effectue par un code, le tracker, qui recense l'historique des actions faites par l'appareil. Ce processus s'appelle aussi historique de navigation ou cookie. À la prochaine connexion de l'ordinateur ou du smartphone, le tracker envoie ces informations sous la forme d'un langage codé, le script.

Comment Tracker un site ?

Une balise web est une petite balise placée sur un site web ou dans un e-mail pour suivre la manière dont l'utilisateur interagit avec le contenu. La balise est généralement une image transparente de 1 pixel sur 1 pixel placée dans le code de la page web.