Les jeux à champ moyen

Embouteillage

Embouteillage en Algarve, Portugal.

Dans cette autre brève sur la congestion, il est question d’équilibre atteint par un grand nombre d’automobilistes qui cherchent individuellement à minimiser leur temps de parcours mais qui subissent les conséquences des choix des autres automobilistes via la congestion éventuellement provoquée. En termes physiques, on pourrait voir l’automobiliste dans son véhicule comme une particule qui est soumise à l’action du champ créé par toutes les autres particules (i.e. les autres véhicules). Tout comme dans cette brève, cette situation où des acteurs rationnels prennent des décisions qui amènent à une situation d’équilibre relève de la théorie des jeuxLa théorie des jeux à champ moyen, proposée en 2006 indépendamment par J-M. Lasry et P-L. Lions d’une part et  P. CainesM. Huang et R. Malhamé d’autre part, connaît actuellement un développement rapide. Le but est d’étudier des jeux du même type que celui des automobilistes : les agents, en grand nombre et tous de même nature, cherchent à optimiser l’état dans lequel ils se trouvent, mais leurs préférences dépendent partiellement du choix des autres agents. On dit qu’ils subissent  un champ moyen créé par les autres agents.

Pour un nombre fini d’agents, ce type de jeux est bien décrit par la théorie des équilibres de Nash, mais on est alors confronté à de grandes difficultés car il faut tenir compte de toutes les interactions. De plus, ces équilibres ne sont en général ni uniques ni stables, ce qui rend les approches quantitatives presque impossibles. J-M. Lasry et P-L. Lions ont alors proposé une approche inspirée de la physique statistique pour décrire la situation limite où le nombre de joueurs tend vers l’infini. Sous certaines hypothèses, le passage à la limite conduit à considérer un seul joueur-type qui détermine sa stratégie optimale en tenant compte d’un champ moyen représentant l’impact de tous les autres joueurs. Ce champ peut souvent se déduire de la densité de joueurs (n’oubliez pas qu’ils sont maintenant en nombre infini !). Par exemple, ce champ peut être une fonction croissante de la densité : plus il y a de joueurs au m2, plus le champ est fort. L’évolution de cette densité est quant à elle décrite par une équation aux dérivées partielles d’un type bien connu des mathématiciens. Cette équation dépend à son tour d’un coût intégral que le joueur-type cherche à minimiser via une commande. Pour déterminer la meilleure commande, ou commande optimale, la programmation dynamique conduit à une équation dite de Bellman.

Le fait frappant est que, sous des hypothèses naturelles sur le plan économique ou social, ce nouveau système formé des deux équations de contrôle optimal et d’évolution de la densité n’a qu’une seule solution, et celle-ci est stable. Ceci ouvre la voie à des approches quantitatives. De plus, dans des situations particulières, on peut interpréter le problème comme celui d’un planificateur cherchant à optimiser l’évolution d’une distribution d’agents (principe d’efficacité).

Brève rédigée par Yves Achdou (Univ. Paris Diderot) et Cyril Imbert (CNRS et Univ. Paris-Est Créteil) d’après les travaux de J.-M. Lasry (Univ. Paris-Dauphine) et P.-L. Lions (Collège de France et Univ. Paris-Dauphine).

Pour en savoir plus :

Crédits Images : Wikimedia Commons.

Leave a Reply

Your email address will not be published. Required fields are marked *

*