--

2 : Janus statistique

On ne compare pas n’importe quoi n’importe quand. Il y a des précautions à prendre.
 

Lorsque l’on veut comparer deux niveaux d’une même grandeur (revenu, production, emploi, population, etc.) entre deux dates, deux pays, deux catégories, et que ces niveaux présentent un écart important, le pourcentage qui exprime cette comparaison est non seulement opposé en signe, mais surtout très différent en valeur absolue selon celui des deux niveaux retenu pour base de comparaison.

Cette constatation est troublante, car bien que le problème de comparaison soit parfaitement clair en lui-même, il semble qu’il ait deux solutions, aussi valables l’une que l’autre, mais différentes, dont le choix est laissé au gré et donc à l’arbitraire du commentateur.

D’où la perplexité exprimée par Roland Pfefferkorn, ci-contre.

Pourtant la situation est moins grave qu’on ne pourrait le penser. Cet optimisme relatif repose à la fois sur une considération technique et sur les conditions de pertinence de la comparaison envisagée.

Si une grandeur, au niveau a à la date 1, augmente de 20% pour passer au niveau b à la date 2, il est faux de penser que pour revenir au niveau a à la date 3, elle devra baisser de 20%. Ce qui est correct, c’est de dire qu’après avoir été multipliée par 1,2 pour passer de a à b, la grandeur considérée doit être divisée par 1,2 (c’est-à-dire multipliée par 0,833) et donc baisser de 16,7 %, pour retrouver son niveau initial. La réversibilité vaut pour les coefficients multiplicateurs, mais pas pour les pourcentages.

Le travail statistique de comparaison de niveaux, comme tout travail statistique, est généralement effectué pour répondre à une question préalable, pour apporter de l’information, éclairer une décision, mettre en évidence ou quantifier un besoin. L’information nouvelle doit pouvoir s’intégrer à un savoir préalable, être comprise et être adaptée aux préoccupations de l’utilisateur. Nous pensons que ces contraintes, suffisamment explicitées, devraient, dans la plupart des cas, permettre de se tirer d’embarras. Prenons quelques exemples.

Pour que l’information soir plus facilement compréhensible, on utilisera plutôt une base locale (on comparera la production allemande d’automobiles à la production française), ou un standard reconnu (économie dominante, niveau de référence, « modèle » culturel ou mode de vie, etc.) ou une situation plus fréquente (le taux d’activité des femmes sera comparé à celui des hommes par exemple).

Si l’information est plus directement orientée vers la prise de décision, la mise en évidence d’un besoin d’action ou d’une marge de progrès, la situation souhaitable devrait constituer la référence. On comparera ainsi le salaire des femmes à celui des hommes si on estime que l’écart est dû, en partie au moins, à une discrimination qu’il conviendrait d’éliminer. De même pour le chômage. En revanche, si on évoque la longévité, on constatera que l’espérance de vie des hommes est inférieure de x années à celle des femmes.

Sur un même sujet, plusieurs points de vue peuvent entrer en concurrence et conduire à des choix différents de base de comparaison, mais pour éviter la confusion, il conviendra alors de se mettre d’abord d’accord sur celui qui sera privilégié, ou de préciser que telle préoccupation incite à choisir telle base de référence. De sorte que le contexte de signification ou d’utilisation devrait conduire dans la plupart des cas à une solution satisfaisante à ce problème de choix.

Ce contexte aide aussi à faire le bon choix pour la nature de l’indicateur qui exprime la comparaison. Si le pourcentage est le plus fréquemment pratiqué, il n’est pas toujours le mieux adapté. La prise en compte de l’écart en valeur absolue est aussi souvent jugée nécessaire. Il en est ainsi par exemple pour la durée de vie, et plus généralement en démographie. C’est aussi le cas en matière de revenus individuels considérés du point de vue de leur utilisation.

Claude Bressand

 
Pénombre, Août 1996