HomeProductsDownloadOrderSupportSearch
  
 
 Myriad Blog 1.3.0 Thursday, Mar 28th, 2024 at 03:13pm 

Friday, Jun 19th, 2009 at 05:01pm
Ils savent tout...

 
 
Complètement par hasard, au gré d'une recherche sur le Web, nous sommes tombés sur une page présentant la répartition démographique, ethnique, ainsi que l'âge ou le revenu mensuel moyen des personnes qui visitent notre site Web.
 
Les statistiques d'accès à notre site étant protégées, et de toute façon nous-même ne possédant pas autant de renseignements sur nos visiteurs, nous avons tout de suite pensé à une imposture, voire à une escroquerie. Il est en effet facile de générer des données au hasard, et d'essayer d'attirer ainsi le pigeon.
 
Mais rapidement, après la consultation des données d'autres sites dont nous connaissions les spécificités, nous avons dû nous rendre à l'évidence: ce n'est pas du n'importe quoi. Il semble bien que les données présentées soient valides. Par contre, elles ne concernent que les seuls visiteurs américains.
 
On peut cependant bien s'amuser, comparer, et pourquoi pas, mieux s'imaginer le profil du visiteur américain moyen de chacun des sites que l'on fréquente.  
 
Comment font-ils? A moins qu'ils ne soient de mêche avec des fournisseurs d'accès pour récupérer leurs fichiers log, il ne peut s'agir que d'un panel d'internautes (qui doit alors être très large) équipé de logiciels mouchards. Nous espérons que ce n'est pas à leur insu.  
 
Allez, amusez-vous avec ce site (et regardez si vous êtes notre visiteur-type) :  http://www.quantcast.com
by Olivier Guillion
Comments

Comment from bubu42 Friday, Jun 19th, 2009 at 07:08pm
visiteur-type
On avait déjà le profil-type américain depuis longtemps : c'est celui de Mr. Richard Lynn West de l'Arkansas, salué en son temps par François le Québécois.  

Comment from Jean-Armand Saturday, Jun 20th, 2009 at 00:29am
L'explication est sur le site
Il faut lire l'explication sur le site :
http://www.quantcast.com/docs/display/info/Next+page4
Ce n'est toutefois pas très clair. Leur technique de base est, je pense, l'utilisation de cookies mis par des publicités sur différents sites. Cela permet d'inférer des relations entre sites, lorsque l'on s'aperçoit qu'une même adresse IP visite deux sites différents.
Dans une seconde étape, Quantcast se sert de sources dont les caractéristiques sont connues - sans doute des utilisateurs de sites où il faut se loguer. Le site fournit sans doute à Quantcast les caractéristiques (âge, sexe, etc.) de leurs visiteurs, ainsi que les diverses adresses IP qu'ils utilisent. Quantcast regarde ensuite les autres sites visités par ces adresses IP, et en déduit le type de personnes qui visite ces autres sites.
 
Pour finir, Quantcast utilise des inférences statistiques du type : "deux personnes qui visitent les mêmes sites ont des caractéristiques communes". Cela permet, à partir d'une base sans doute réduite de personnes connues, de propager sur l'ensemble des adresses IP les statistiques sur l'âge, le sexe, etc., et donc de propager ces mêmes statistiques sur l'ensemble des sites Internet.
Vous noterez que l'équipe R&D de Quantcast compte deux professeurs de statistiques de Stanford.
 
Dernier point, comment font-ils pour avoir une statistique sur le salaire ou la couleur de peau ? Je pense que cela vient de ce que, aux USA, ces informations sont beaucoup plus publiques qu'en Europe. Les personnes n'hésitent pas à donner leur salaire ou leur couleur de peau en s'inscrivant sur des sites. Le salaire est d'ailleurs obligatoire pour demander les versions Gold des cartes bancaires, et enfin, les banques connaissent le salaire de leurs clients. Peut-être Quantcast a t-il des accords avec des banques. Sans doute ont-ils aussi dans leurs base la religion : aux US c'est une information peu protégée, de plus les sites de compagnies aériennes le demandent, pour prévoir des repas adaptés.

Comment from Jean-Armand Saturday, Jun 20th, 2009 at 00:43am
Biais
Au passage, Quantcast se vante d'avoir une méthode qui évite les biais statistiques, mais il y a tout de même des biais qu'ils ne peuvent pas éviter :
- Lorsque plusieurs personnes utilisent le même ordinateur. Typique à la maison. Quantcast risque d'en déduire que les sites pour adolescents sont fréquentés par plus d'adultes que dans la réalité. De plus il y a un biais avec le salaire (dans les foyers plus riches, chacun a son ordinateur) : la surestimation du taux de fréquentation par des adultes sera moindre dans le cas d'adultes riches.
- Leurs sources de référence ont sans doute un biais, par exemple ce sont des personnes qui utilisent Internet pour communiquer avec leur banque, ce qui n'est pas le cas de tout le monde ; cela montre que la personne a une bonne confiance dans l'économie numérique.
 
Mais on peut noter que les méthodes classiques ont elles aussi leur biais : par exemple, les enquêtes d'instituts de sondage, qui s'effectuent par téléphone ou dans la rue ou sur rendez-vous, ont tendance à sélectionner des gens qui ont du temps à perdre, ce qui est un biais important.

Comment from Jean-Armand Saturday, Jun 20th, 2009 at 00:49am
J'ai essayé sur un site que je fréquente
J'ai essayé sur un site que je fréquente, Quantcast a répondu (en anglais) : "Désolé, nous n'avons pas assez de données statistiques pour afficher le profil de ce site.
Si ce site est à vous, vous pouvez le Quantifier en ajoutant un petit tag javascript, de sorte que nous puissions vous donner une analyse de trafic précise."
 
J'imagine que ce javascript va lire / écrire des données dans le cookie de Quantcast, ce qui permet à Quantcast d'en déduire les autres sites que fréquente la personne, donc son profil.

Comment from Geo Saturday, Jun 20th, 2009 at 01:46pm
Pas besoin de cookie
Bonjour
Un certain nombre de fournisseurs, dont l'inévitable Google, savent sans cookie que vous êtes passé sur tel ou tel site à tel moment, au moyen de codes ajoutés sur les pages visitées.
Avec IE8, on peut contrecarrer ces suivis à partir du moment où les différentes pages que vous avez consultées se sont connectées au moins 3 (ou plus) fois au même site.
C'est l'option "filtrage in private" (et non "Navigation in Private").
Peu importe l'outil, c'est juste pour dire que l'utilisateur se fait piéger, même s'il bloque ou supprime les cookies.


Most recent first
Oldest first

Top of page
Legal information Cookies Last update:  (c) Myriad