computing solution concepts of normal-form games

20
Computing Solution Concepts of Normal-Form Games Por: Iván Huerta.

Upload: ivan-huerta-corona

Post on 22-Jan-2018

223 views

Category:

Software


5 download

TRANSCRIPT

Computing Solution Concepts of Normal-Form Games Por: Iván Huerta.

Teoría de juegos.

El equilibrio de Nash en juegos simples puede ser “fácil” ya que solo hay dos jugadores y ellos solo tienen dos acciones.

Equilibrio de Nash para juegos de dos jugadores / suma cero.

´  El computo de el problema del Equilibrio de Nash puede ser expresado mediante programación lineal.

´  Así que los problemas modelados de está forma pueden ser resueltos de forma polinómica.

Equilibrio de Nash para juegos de dos jugadores / suma cero.

Equilibrio de Nash para juegos de dos jugadores / suma cero.

Variables de holgura o excedente. Son variables que se agregan a la restricción para que larelación de la restricción sea de igualdad (representa el valor que le hace falta al lado izquierdopara ser igual al lado derecho). Ambos tipos de variables tienen que cumplir con la restricciónde no negatividad

Computing Nash equilibria of two-player, general-sum games.

´  Desafortunadamente, el problema de encontrar un Equilibrio de Nash en un juego de dos jugadores y suma general no puede ser formulado en PL.

´  Porque los jugadores no tratan de minimizar las utilidades de sus oponentes.

An LCP formulation and the Lemke–Howson algorithm

´  El algoritmo Lemke–Howson.

´  Es el mejor algoritmo que permite encontrar el Equilibrio de Nash en un juego de Suma general.

The LCP formulation.

´  Los problemas de suma general para dos jugadores no pueden ser formulados en PL, pero pueden ser formulados como un “Problema de Complementariedad Lineal”(LCP).

El nombre proviene de la condición xTy = 0 que se llama condición de complementariedad ya que requiere que al menos una de las variables del par (xj,yj) sea igual a cero en la solución del problema, para j=1,...,n.

The LCP formulation.

The Lemke–Howson algorithm.

The Lemke–Howson algorithm.

Reescribiendo…

Las formulas tienen la siguiente forma v = c + qu + T, donde v es la variable de choque, c es una constante (inicialmente todos ellas son 1), u es la variable de entrada, q es un coeficiente constante, y T es una combinación lineal de variables que no sean v o u.

La variable de choque para salir es el que está en cuya ecuación la relación q / c es más pequeño.

Pivoteando…

Salida…

Propiedades el algoritmo Lemke-Howson.

´  Encuentra una muestra del Equilibrio de Nash en el juego.

´  Se puede encontrar más de una muestra del Equilibrio de Nash.

´  No garantiza encontrar un equilibrio ya que hace un recorrido por nodos conectados.

´  No garantiza que ha encontrado todos los Equilibrios de Nash.

Beyond sample equilibrium computation.

´  No solamente interesa buscar una muestra del Equilibrio de Nash; sino encontrar un equilibrio con propiedades específicas.

´  Teorema.

´  Computar todos los equilibrios para dos jugadores, en un juego de suma general exige el peor caso en tiempo , que es exponencial según el número de acciones de cada jugador.

Computing Nash equilibria of n-player, general-sum games

´  Para los juegos de n-jugador en el que n ≥ 3, el problema de encontrar un equilibrio de Nash ya no puede ser representados incluso como LCP

´  Para ello existen varios enfoques.

Computing Nash equilibria of n-player, general-sum games

´  En lugar de resolver el problema complementariedad no lineal exactamente, ha habido cierto éxito en la aproximación de la solución usando una secuencia de problemas complementariedad lineales (SLCP).

´  Cada LCP es una aproximación del problema, y su solución se utiliza para crear la siguiente aproximación en la secuencia.

´  Aunque este método no es globalmente convergente, en la práctica, a menudo es posible probar un número de diferentes puntos de partida, debido a su velocidad relativa.

Computing maxmin and minmax strategies for two-player, general- sum games ´  Sea G un juego arbitrario de dos jugadores G = ({1, 2}, A1 × A2, (U1, U2)).

´  Calculando maxmin para 1obtenemos: G '= ({1, 2}, A1 × A2, (u1, -u1)).

´  Por definición, la estrategia maxmin del jugador 1 es independiente de la función de utilidad del jugador 2. Por lo tanto, la estrategia maxmin del jugador 1 es el mismo en G y G ’.

´  Nuestro problema de encontrar una estrategia maxmin en G reduce así a la búsqueda de un equilibrio de Nash de G '

Referencias.

´  Sobre el uso del problema de complementariedad lineal extendido para el control óptimo de semáforos, S. Allende Alonso,Universidad de la Habana (La Habana-Cuba) ,C. S. Lema Fernández ,L. P. Pedreira Andrade

´  Game Theory and Algorithms∗ Lecture 6: The Lemke-Howson Algorithm.

´  C. E. Lemke and J. J. T. Howson. Equilibrium points of bimatrix games. SIAM Journal on Applied Mathematics, 12(2):413–423, 1964.

´  MULTIAGENT SYSTEMS ,Algorithmic, Game-Theoretic, and Logical Foundations , Yoav Shoham.