Le paradoxe de Newcomb appliqué au recrutement

Soient deux boîtes A et B qui contiennent une somme d’argent inconnue et fixée à l’avance. Le joueur a le choix entre choisir la boîte A seule ou choisir les deux boîtes (A+B).

On suppose par ailleurs l’existence d’un devin capable, avec un taux de réussite de (mettons) 90%, de prédire les choix des joueurs.

Le contenu des boîtes est déterminé comme suit :

  • La boîte B contient toujours 1 euro ;
  • Le contenu de la boîte A dépend de la prédiction du devin : s’il a prédit que le joueur choisira la boîte A seule, elle contient 1,000 euros ; s’il a prédit que le joueur choisira les deux boîtes, elle est vide.

Il y a donc quatre cas possibles en fonction de la prédiction du devin et du choix du joueur :

Prédiction Choix Gain
A A 1,000
A+B A+B 1
A A+B 1,001
A+B A 0

Étant donnés ces éléments, quelle est la meilleure stratégie ? Les joueurs ont-ils intérêt à choisir la boîte A seule ou les deux boîtes ?

Les deux boîtes

Quelle que soit la prédiction du devin, prendre les deux boîtes rapporte toujours plus : s’il a prédit A+B, vous gagnez 1 euro en lui donnant raison plutôt que zéro en sélectionnant la boîte A seule ; s’il a prédit A, vous gagnez 1,001 euros en prenant les deux boîtes plutôt que 1,000 en confirmant sa prédiction. En d’autres termes, peu importe la prédiction du devin et la fiabilité d’icelle, la stratégie A+B domine la stratégie A au sens de la théorie des jeux.

On peut illustrer cette idée en supposant que les prédictions du devin sont équiprobables — il y a une chance sur deux pour qu’il ait prévu A et une chance sur deux pour qu’il ait prévu A+B — auquel cas l’espérance de gain de la stratégie A+B est de 501 euros contre 500 pour la stratégie A.

La boîte A

Mais si nous considérons que le devin a raison dans 90% des cas, il a une autre façon de calculer l’espérance de gain des deux stratégies. En effet, vue sous cet angle, la stratégie A+B a 90% de chance de ne rapporter qu’un euro (le devin a raison) et seulement 10% de chances de rapporter 1,001 euros ; soit une espérance de gain de 101.

Or, dans cette optique, la stratégie A a 90% de chance de générer un gain de 1,000 et seulement une chance sur dix de ne rien rapporter du tout ; soit une espérance de gain de 900 euros. On en arrive donc à la conclusion inverse : il vaut mieux ne choisir que la boîte A.

Le paradoxe

C’est le paradoxe de Newcomb : ces deux façons d’aborder le problème sont aussi rigoureuses et rationnelles l’une que l’autre et pourtant, elles s’excluent mutuellement. La manière dont vous calculez votre espérance de gain et donc le choix que vous ferez dépend de la façon dont vous envisagez le problème : si vous vous concentrez sur la probabilité associé aux prédictions possibles du devin, vous choisirez les deux boîtes mais si vous concentrez votre attention sur la capacité prédictive du devin, vous opterez pour la boîte A seule.

L’intérêt du paradoxe de Newcomb, outre les abîmes de perplexité dans lesquels il plonge ceux qui cherchent à le résoudre, est très bien résumé Robert Nozick (1969) : « Pour presque tout le monde, la bonne stratégie est parfaitement claire et évidente. La difficulté vient du fait que le problème semble diviser les gens en deux groupes à peu près égaux ; nombre d’entre eux estimant que le choix des autres est juste stupide. »

Une application possible

Mis à part un sujet vaguement lié dont je ne peux pas vous parler sous peine de vous condamner à d’éternels tourments [1], la raison qui me pousse à vous parler de ce paradoxe, c’est qu’on peut, il me semble, en faire un extraordinaire outil de mesure de la souplesse intellectuelle et de la capacité à se remettre en cause d’un candidat.

Il se trouve que, ces derniers jours, j’ai participé à quelques jurys d’admission en école de commerce (pour Kedge) et qu’au moment de remplir la grille d’évaluation qu’on nous propose, j’ai souvent été bien embêté lorsqu’il s’est agi de juger de ce type de qualités (c’est aussi le cas de la créativité mais je pense avoir trouvé une solution tout à fait acceptable pour ça).

Voilà comment j’imagine le « protocole expérimental » : dans un premier temps, on soumet le problème au candidat de telle sorte qu’il arrive à sa solution et se convainc d’être dans le vrai (durant l’entretient ? avant ?) puis, en entretient, on lui demande de nous démontrer pourquoi il aurait dû choisir l’autre.

Ce qui est intéressant, c’est que tous les résultats possibles sont très riches en informations. Un candidat incapable de démontrer qu’il faut choisir telle ou telle solution, à priori, n’a pas grand-chose à faire dans une école de commerce ; un candidat qui parvient à une conclusion mais se révèle incapable de changer de point de vue peut sans doute être considéré comme passable et un candidat qui parvient à argumenter successivement les deux approches mérite très certainement notre attention.

Évidemment, les champions toutes catégories sont ceux qui vont identifier le paradoxe ; la seule difficulté sera alors de les distinguer de ceux qui connaissaient le truc — peut-être pas aussi forts que les précédents mais sans doute dotés d’une culture générale et d’une curiosité intellectuelle de premier ordre.

Bref, avis aux recruteurs et autres jurys : votre avis m’intéresse.

---
[1] Si vous êtes très courageux ou doté d’un solide bon sens, rendez-vous à la note suivante sinon : fuyez pauvres fous !
[2] Le Basilic de Roko :p

Aucun commentaire:

Enregistrer un commentaire

ChallengeR #8 - Solutions

Votre mission consistait donc à trouver un moyen de faire en sorte que : > x == 0 [1] TRUE > x + 1 == 2 [1] TRUE > x / 2 == 1 [1...