1 sur 73 millions

La plupart des gens ne comprennent pas les probabilités et les statistiques. L’esprit humain s’accommode mal des probabilités. Pensez-y un instant : qu’entend-on exactement lorsque l’on dit « Il y a 70% de chances qu’il fasse beau demain » ? Qu’il fera beau 70% de la journée ? Qu’il fera beau sur 70% du territoire ? Que sur 100 météorologistes, 70 prévoient qu’il fera beau ? Ou encore que sur 100 cas où cette prévision est faite, il fera beau 70 fois ?

PROBABILITÉ CONDITIONNELLE

Le type de probabilité auquel nous sommes le plus souvent exposé dans la vie quotidienne sont des probabilités conditionnelles. Une probabilité conditionnelle P(A|B) est définie par un simple ratio :

Probabilité conditionnelle

Le biais cognitif que je vais aborder ici consiste à confondre une probabilité conditionnelle P(A|B) avec la probabilité conditionnelle symétrique P(B|A).

Par exemple, la probabilité d’être fumeur sachant que l’on a un cancer du poumon, P(Fumeur|Cancer), est très différente de la probabilité d’avoir un cancer du poumon sachant que l’on est fumeur, P(Cancer|Fumeur). Ces deux probabilités conditionnelles ont en commun l’effectif des personnes qui sont fumeurs et qui ont un cancer du poumon. Si l’on rapporte cet effectif à l’effectif des personnes atteintes d’un cancer du poumon, on obtient la probabilité P(Fumeur|Cancer) ; si l’on rapporte cet effectif à l’effectif des fumeurs, on obtient la P(Cancer|Fumeur). Comme l’effectif des fumeurs est très supérieur à l’effectif des personnes atteintes d’un cancer du poumon, P(Cancer|Fumeur) est très inférieure à P(Fumeur|Cancer). C’est cette dernière probabilité qui est utilisée pour dissuader les gens de fumer, sous la forme : « 90% des cancers du poumon sont provoqués par le tabac ».

Fumeurs Cancer

Donc P(A|B) est différente de P(B|A). Le théorème de Bayes met en relation ces deux probabilités conditionnelles :

CodeCogsEqn(6)

L’ERREUR DU PROCUREUR

Lorsqu’elle se produit dans le cadre judiciaire, l’erreur consistant à confondre une probabilité conditionnelle avec la probabilité conditionnelle symétrique peut avoir des conséquences dramatiques car elle peut amener à surestimer substantiellement les chances qu’un accusé soit coupable et causer ainsi une erreur judiciaire. C’est « l’erreur du procureur » (Prosecutor’s fallacy). Elle prend la forme du raisonnement suivant : « Le criminel présente tel profil, le profil-cible. Le profil de l’accusé correspond au profil-cible. Or la probabilité que le profil de l’accusé corresponde au profil-cible sachant que l’accusé est innocent est infime. Donc l’accusé est très probablement coupable. »

Cette erreur se produit par exemple dans le scénario suivant. Madame X a été violée. Des analyses médicales ont permis d’identifier l’ADN du violeur. Un suspect a été arrêté et son ADN correspond à l’ADN du violeur. Le laboratoire d’analyse précise que la probabilité qu’un innocent ait le même profil ADN que celui du violeur est de 1 sur 3 millions. Donc la probabilité que le suspect soit innocent est de 1 sur 3 millions.

Analysons le mécanisme sous-jacent à l’erreur du procureur. On note :

• M : le profil de l’accusé correspond au profil-cible (le profil du criminel)
• I : l’accusé est innocent
• C : l’accusé est coupable

L’erreur consiste à confondre deux probabilités conditionnelles :

P(M|I) : la probabilité que le profil de l’accusé corresponde au profil-cible sachant que l’accusé est innocent
P(I|M) : la probabilité que l’accusé soit innocent sachant que son profil correspond au profil-cible

L’erreur du procureur consiste à assimiler P(M|I) à la probabilité que l’accusé soit innocent. Comme P(M|I) est souvent très faible, cette erreur rend enclin à penser que l’accusé a peu de chances d’être innocent. Or quand on y pense, il est bien normal que la probabilité de correspondre au profil-cible soit très faible si on est innocent ! Mais cette probabilité n’a rien à voir avec celle d’être innocent. La probabilité que l’on veut estimer au final, c’est P(I|M).

Les deux probabilités conditionnelles P(M|I) et P(I|M) sont reliées par le théorème de Bayes :

procureur_1

Par définition, P(M|C) = 1 (la probabilité de correspondre avec le profil-cible quand on est coupable est 1).

L’exemple fictif suivant est prototypique de l’erreur du procureur. Un meurtre a eu lieu à Londres et le recoupement de différents témoignages a permis de dresser le profil du criminel : un homme, mesurant environ 2 mètres, âgé entre 20 et 30 ans, avec les cheveux teints en rouge, et qui boite de façon prononcée. Un criminologue commence par rappeler les données démographiques suivantes :

• probabilité d’être un homme : 0.51
• probabilité de mesurer environ 2 mètres : 0.025
• probabilité d’être âgé entre 20 et 30 ans : 0.25
• probabilité d’avoir les cheveux teints en rouge : 0.037
• probabilité de boiter de façon prononcée : 0.017

Puis, en rappelant que ces événements sont indépendants, le criminologue avance que l’on peut obtenir la probabilité qu’une personne présente ces 5 caractéristiques à la fois en multipliant ces probabilités :

procureur_2

Un suspect a été arrêté et il présente les 5 caractéristiques du criminel. Penser que la probabilité que le suspect soit innocent est 0.000002 consiste à être victime de l’erreur du procureur.

On peut se rendre compte du caractère erroné de ce raisonnement de façon simple, sans appliquer la formule de Bayes. On sait que la probabilité de correspondre au profil-cible est 0.000002. Sur les 10 millions d’habitants à Londres, il y a donc 20 personnes qui correspondent au profil-cible. Sur ces 20 personnes, 1 est coupable et 19 sont innocentes. Par conséquent, la probabilité que l’accusé soit innocent sachant que son profil correspond au profil-cible est 19/20 = 0.95. On passe de 0.000002 à 0.95 !

Innoncents Profil-cible

Bien évidemment, on obtient le même résultant en passant par la formule de Bayes. Sur les 10 millions d’habitants à Londres, 9 999 999 sont innocents, et parmi eux, 19 correspondent avec le profil-cible, soit P(M|I) = 19/9 999 999.

procureur_3

L’erreur du procureur est une illustration de la difficulté à manipuler des probabilités conditionnelles et à raisonner de façon bayésienne.

L’AFFAIRE SALLY CLARK

Le cas le plus célèbre d’erreur du procureur est incontestablement celui de la britannique Sally Clark. En 1996, son premier enfant Christopher décéda à l’âge de 3 mois. La mort fut attribuée à l’époque au syndrome de mort subite du nourrisson. Un an plus tard, son deuxième enfant Harry mourut dans des circonstances très semblables à l’âge de deux mois. Une procédure judiciaire fut déclenchée. Lors du procès, un expert en pédiatrie, le professeur Roy Meadow, estima que la probabilité que deux nourrissons décèdent du syndrome de mort subite dans une famille comme celle de Sally Clark était de 1 sur 73 millions. Ce chiffre très frappant eut un rôle décisif et celle-ci fut accusée d’infanticide. Après deux nouveaux procès en appel, elle fut finalement relaxée en 2003. Mais en 2007, elle fut découverte morte à son domicile à la suite d’un coma éthylique.

Roy Meadow était parti de données épidémiologiques sur la mort subite du nourrisson. Dans une famille aisée où l’on ne fume pas, il évalua cette probabilité à 1/8543. Par conséquent, la probabilité d’avoir deux nourrissons victimes de ce syndrome au sein d’une même famille serait de 1/8543 × 1/8543 = 1/73 000 000. On peut noter que ce raisonnement n’est valable que si les événements sont indépendants. Or ce n’est vraisemblablement pas le cas ici : dans une famille, la probabilité qu’un nourrisson soit victime d’une mort subite est influencée par le fait d’avoir déjà eu un nourrisson victime de ce syndrome (en raison du rôle de facteurs génétiques et environnementaux). Mais peu importe, ce n’est pas cette erreur qui importe ici.

Le profil-cible correspond au fait d’avoir deux nourrissons qui décèdent coup sur coup. Soit les nourrissons sont morts de façon naturelle (victimes de mort subite) auquel cas Sally Clark est innocente, soit les nourrissons ont été tués auquel cas celle-ci est coupable d’infanticide.

Les personnes impliquées dans ce procès ont été aveuglées par le caractère infime de la probabilité P(M|I) d’avoir deux nourrissons qui décèdent coup sur coup sachant que le parent est innocent, et elles ont négligé le fait que la probabilité P(C) qu’un parent tue ses deux nourrissons coup sur coup est encore plus faible. Le statisticien Philip Dawid (2002) avait évalué cette probabilité à 1 sur 8.4 milliards. Autrement dit, sur les infiniment rares cas où deux nourrissons décèdent coup sur coup dans une famille, la très grande majorité de ces cas (A) relèvent du syndrome de mort subite et seulement quelques cas (B) sont dus à un infanticide. Donc le ratio A/(A+B) est très élevé.

L’application de la formule de Bayes dans l’affaire Sally Clark donne :

procureur_4

La probabilité que Sally Clark soit innocente frôle donc la certitude. Ce qui est frappant, c’est que beaucoup de gens ont cru que la probabilité qu’elle soit innocente était 1 sur 73 millions alors qu’en réalité cette probabilité est 99 sur 100 !

Comme on peut l’imaginer, le cas Sally Clark a été très commenté. Il montre comment même des experts (professeurs, médecins, juristes) sont affectés par les biais cognitifs relatifs à la compréhension des probabilités et des statistiques, et comment ces biais peuvent produire des erreurs judiciaires désastreuses.

Les recherches en psychologie cognitive ont largement montré que les gens sont victimes de biais cognitifs. Ce fait étant bien établi, l’étape suivante consiste à leur apprendre à être conscients de ces biais et à s’en défaire. Comme le soulignait H.G. Wells, “Statistical thinking will one day be as necessary for efficient citizenship as the ability to read and write.

Share on FacebookTweet about this on TwitterEmail this to someone