TAZ-TFG-2023-3726


El juego del truelo. Un enfoque basado en cadenas de Markov y teoría de juegos.

Arnal Julve, Carmen Pilar
Alcalá Nalvaiz, José Tomás (dir.)

Universidad de Zaragoza, CIEN, 2023

Graduado en Matemáticas

Resumen: El juego del truelo fue estudiado inicialmente por C. Kinnaird alrededor del año 1946. Sin embargo, fue Kilgour quien desarrolló en mayor profundidad las múltiples formas que puede tomar el juego y el interés que tiene en cuanto a la modelización del comportamiento de una población cuando se trata de la transmisión de opiniones.
La manera más intuitiva de entender el juego es plantearlo como una extensión del duelo tradicional, donde dos personas se enfrentan con el objetivo de que finalmente haya un único superviviente, pero en este caso con tres jugadores. En particular, en el truelo encontramos a tres jugadores, A, B y C, cuya puntería podemos cuantificar como las probabilidades a, b y c, respectivamente, entre 0 y 1 que tienen de acertar al contrincante al que decidan disparar.
El juego comienza con tres jugadores y, dependiendo de la variante del juego, se elige a uno de ellos utilizando un cierto criterio (orden aleatorio, primero el más débil, etc.) para que dispare. A continuación, éste decide cuál es su objetivo (o incluso puede decidir apuntar al aire) y dispara, pudiendo eliminarlo o fallar y que ambos vuelvan a participar en la siguiente ronda. Independientemente de si el jugador consigue acertar o no, otro es elegido para que dispare y así sucesivamente hasta que sólo quede vivo uno de los tres.
En este trabajo se utilizan, por un lado, la teoría de juegos y, por otro lado, las cadenas de Markov para deducir la estrategia óptima que deben tomar los participantes del truelo así como para estudiar ciertos resultados paradójicos que surgen cuando los participantes adoptan dicha estrategia.
El primer capítulo, que es el más extenso, recopila en primer lugar una amplia terminología de teoría de juegos necesaria para definir los conceptos de estrategia pura y equilibrio de Nash. En segundo lugar, se proponen y demuestran diferentes resultados sobre cadenas de Markov que más adelante se utilizan para el estudio de la probabilidad de supervivencia que posee cada jugador y el tiempo esperado de la duración de una partida. La idea principal es que se plantean cadenas cuyos estados son las diversas combinaciones de participantes del juego que puede haber vivos en cada momento (y en alguno de los casos también incluyen a qué jugador le toca disparar). Seguidamente, se plantea de forma breve la modelización de un duelo con cadenas de Markov. Por último, la parte más extensa del capítulo 1 se dedica al estudio del truelo en dos variantes diferentes: aleatorio, donde en cada ronda se decide aleatoriamente qué jugador tiene el turno para disparar, y secuencial, donde mediante un orden preestablecido (en este trabajo disparan en orden ascendente de puntería, es decir, empieza el más débil y acaba el más hábil) los jugadores van tomando su turno en cada ronda.
Mientras que en el duelo es obvio que a cada jugador lo que más le conviene es disparar a su contrincante para que su probabilidad de supervivencia sea máxima, en el juego del truelo no está tan claro a quién es más ventajoso disparar. Aquí es donde adquiere relevancia el concepto del equilibrio de Nash, pues es el que proporciona una estrategia óptima para cada jugador teniendo en cuenta que los tres toman decisiones racionales y que no se van a dar alianzas ni van a cooperar entre ellos. El equilibrio de Nash, que es único, puede definirse como el conjunto de las estrategias que debe tomar cada uno de los participantes de un juego de forma que para cada uno ésta sea la óptima considerando que el resto de los jugadores no va a cambiar la suya. Es decir, en el equilibrio de Nash se encuentra la estrategia óptima para cada jugador en el sentido de que si alguno de ellos decidiera cambiarla unilateralmente nunca saldría beneficiado. En particular, para el caso del truelo el equilibrio de Nash indica el jugador al cual le conviene más atacar a cada uno para proporcionarle una probabilidad de supervivencia que nunca van a mejorar si cambia de forma individual de estrategia.
Para el truelo aleatorio, dicho equilibrio es el conjunto de estrategias que llamaremos atacar al más fuerte, ya que cada jugador apunta en su turno a aquel que tenga mayor puntería (y no sea él mismo). Para el truelo secuencial, el punto de equilibrio varía según el valor que toma una cierta función g dependiente de los valores de las punterías a, b y c. Cuando g>0, el punto de equilibrio es la estrategia de atacar al más fuerte ya mencionada, mientras que cuando g<0, el punto de equilibrio se encuentra cuando A y B se atacan el uno al otro y C dispara al cielo.
Ahora, el resultado paradójico que aparece en el juego del truelo y que queda ilustrado y ejemplificado en el trabajo, consiste en que en el punto de equilibrio correspondiente a cada caso se pueden encontrar valores de a, b y c para los cuales el jugador con menor probabilidad de supervivencia es el más hábil y el que tiene mayor probabilidad de ganar el juego es, precisamente, el que posee la peor puntería. El truelo secuencial es donde se hace más notable este resultado contra intuitivo, pues ocurre en mayor proporción que en el truelo aleatorio, aunque en éste último también tiene una relevancia notable.
En el segundo capítulo del trabajo se ve cómo puede llevarse el modelo propuesto para el truelo aleatorio a la modelización de la transmisión de opiniones en un grupo de tres individuos, cada uno con una opinión inicial diferente, A, B o C, y una cierta capacidad de convicción, a, b o c, asociada a cada opinión. Por ejemplo, aquel que mantiene la opinión A tiene una probabilidad a entre 0 y 1 de convencer al individuo que elija. Además, en este capítulo también queda explicado un modelo propuesto por Amengual y Toral que inicialmente utilizan para modelizar cómo se desarrollaría un truelo aleatorio colectivo, pero que puede emplearse para estudiar la transmisión de tres opiniones diferentes que inicialmente se encuentran en una proporción dada en una población de N personas.
Este modelo resulta muy interesante por todas sus posibles aplicaciones a situaciones cotidianas (propagación de una opinión política, etc.). Sin embargo, hay que destacar que los casos en los que se obtienen resultados contraintuitivos ocurren en mucha menor medida en comparación con el truelo aleatorio o secuencial.
Finalmente, en el tercer capítulo se utiliza Maxima para, con el código ya empleado para hallar las probabilidades de supervivencia, calcular estas probabilidades para unos ciertos valores concretos de a, b y c y para los posibles conjuntos de estrategias puras elegidas por los participantes del truelo. El estudio de casos concretos facilita la explicación del razonamiento a seguir para llegar a la conclusión de cuál es el punto de equilibrio tanto en el caso aleatorio como en el secuencial.


Tipo de Trabajo Académico: Trabajo Fin de Grado

Creative Commons License



El registro pertenece a las siguientes colecciones:
Trabajos académicos > Trabajos Académicos por Centro > Facultad de Ciencias
Trabajos académicos > Trabajos fin de grado



Volver a la búsqueda

Valore este documento:

Rate this document:
1
2
3
 
(Sin ninguna reseña)