domingo, 4 de enero de 2009

Decisión y Eficiencia Estratégica I

El presente artículo estará dividido en dos partes: la primera, analizará la mejor toma de postura de un jugador ante decisiones con riesgo; el análisis de la segunda parte estará basado en la Teoría de juegos.

En una partida de Magic, ambos jugadores han de decidir una serie de jugadas que les pueden dar la victoria o arrebatársela. En varias ocasiones, la decisión de jugar una Hojalatera buscando un Coloso/Platino y tener la certeza de que ésta se resolverá (dándonos así, la partida y por ende, el hipotético resultado máximo: 10 v.gr.), es absoluta. Es decir, es una decisión con certeza. Un lúcido paradigma de esta situación es cuando nos hayamos ante el siguiente contexto: el Jugador 1 –poseedor de la Hojalatera- goza de la información de que el Jugador 2 esgrime una MUD o una Manaless Ichorid; ergo, el Jugador 1 sabe que la situación ante la decisión de que juegue la Hojalatera –y se resuelva- es una situación con certeza pues sabe las consecuencias de jugarla o no jugarla. No es necesario que la información disponible sea sobre el tipo de deck sino que también, una Coacción e.g. nos da la misma información sobre en qué situación nos encontramos en ese preciso instante y siguiendo con el ejemplo anterior, si se resolverá la Hojalatera. Como estos ejemplos podemos hallar muchos más.

Así, los elementos latentes que nos encontramos en una decisión con certeza son tres (necesarios para seguir el hilo del artículo), a saber: el conjunto de consecuencias posibles, una función de utilidad que represente las preferencias del jugador y que las preferencias sean consistentes.

¿Qué es el conjunto de consecuencias posibles? La respuesta se entenderá mejor con un ejemplo: el Jugador 1 de TPS se ha lanzado a combar por que los robots de la Red Shop Aggro que tiene enfrente no le dan más turnos; así, puede jugar la Voluntad de Yawgmoth con los tres últimos mana que le quedan (con el hipotético resultado máximo de 10) o bien no jugar nada y dar turno (con un resultado de -10). En el presente ejemplo, el conjunto de consecuencias posibles X, es: X = (Perder, Ganar) o… X = (-10, 10).

¿Qué significa que las preferencias sean consistentes? Las preferencias (es decir, lo que a un individuo le agrada o no) son consistentes si y solo si se cumple que sean completas y transitivas. Éste elemento se ha enunciado, no obstante, se ha hecho como una cuestión formal no imprescindible para entender la esencia del artículo.

¿Qué significa que la función de utilidad represente las preferencias del jugador? Una función de utilidad es una herramienta para medir el nivel de utilidad (entendida como felicidad) de un jugador de Magic. Una situación es eficiente si no se puede mejorar la situación de un jugador sin empeorar la del otro. Además, la decisión del jugador será eficiente si aprovecha de la mejor manera posible los recursos disponibles y escasos. Siguiendo con el ejemplo anterior, estimado lector, le hago una pregunta: ¿ud. considera que siempre la situación eficiente es escoger jugar la Voluntad de Yawgmoth, frente dejar pasar turno? Si su respuesta ha sido afirmativa siento comunicarle que no ha entendido los conceptos y le invito a releerlos. La inevitable pregunta que formulará es: ¿por qué Catulo? La respuesta se verá mejor con el mismo ejemplo: el jugador 1 puede decidir jugar la Voluntad de Yawgmoth y ganar o puede existir la situación en que el jugador de Magic escoja ceder turno y dejar ganar al jugador contrario ya sea por que es un amigo/compañero o por que el Jugador 2 obtendría un lugar en el top8 (este artículo no habla de si es correcto o no). Imaginemos que la función de utilidad del jugador 1 se maximiza si el amigo entra en el top8 e imaginemos que la función de utilidad del jugador 2 se maximiza si entra en el top8. Si el Jugador 1 toma la decisión de no jugar la Voluntad de Yawgmoth, en este contexto, la situación se dice que es eficiente en el sentido de Pareto (es decir, mejoramos la situación de un jugador sin empeorar la del otro). Aclaremos, que sería ineficiente si el jugador 1 jugara la Voluntad de Yawgmoth.

Ahora pongámonos en la situación de certidumbre (recordemos que es aquella situación donde el Jugador 1 sabe todas las consecuencias de sus acciones) en que ambos jugadores maximizan su utilidad ganando la partida. Entonces vemos que la decisión del Jugador 1 de jugar la Voluntad de Yawgmoth maximiza su utilidad, pero no la del Jugador 2. Entonces, ¿es eficiente la decisión? Pues si. Es una decisión eficiente pues el jugador 1 está aprovechando sus cartas (en este caso la Voluntad de Yawgmoth) de la manera más optima y además es una situación eficiente pues no podemos mejorar a ningún jugador sin empeorar al otro. En realidad, si las funciones de utilidad de ambos jugadores son como las ultimas descritas (que es como deberían ser siempre), el resultado de la situación del juego de cartas siempre es eficiente (no es de extrañar que los resultados del juego sean coherentes con la teoría, pues debemos recordar que Magic fue diseñado por un doctor en matemática combinatoria).

Las actitudes cambian si tenemos en cuenta que en diversas ocasiones la decisión que escojamos es con incertidumbre. Es decir, los resultados no dependen únicamente de nuestras decisiones, sino que también de otras variables que no controlaremos. Según la estructura informacional hay dos casos: en primer lugar, la variable no controlada se rige por las leyes del azar; en segundo lugar, la variable no controlada son juegos estratégicos (id est, ita est la variable no controlada depende de la decisión de otro jugador/agente racional que tiene sus propios objetivos y actúa en consecuencia). El segundo caso será analizado en el artículo “Decisión y Eficiencia Estratégica II”.

Si analizamos las decisiones que se deberían tomar en situaciones de incertidumbre con variables no controladas basadas en el azar, es inevitable hablar de la lotería. Una lotería es una distribución de probabilidades sobre el conjunto de consecuencias posibles X (ya se definió anteriormente). Una lotería se puede representar de diversas formas. La lectura será más sencilla con un nuevo ejemplo: el jugador 1 tiene en mano una Fuerza de Voluntad, un Ancestral Recall y una Adivinación Esquelética; en mesa: un Mox Pearl, un Mox Ruby, un Mox Emerald, un Erial y una Underground Sea (enderezados todos ellos); y por último, en el cementerio: un Tutor místico, una Verdad reflejada, un Pergamino mercantil y una Coacción. El jugador 2 solo tiene una carta en mano y ésta resulta ser un Juramento de los druidas, que lo juega (el jugador 2, antes de jugar el Juramento, había jugado en ese mismo turno un Time Walk que se resolvió).

El sagaz lector se preguntará: ¿que debo hacer: 1. jugar las Fuerza de voluntad removiendo el Ancestral Recall; 2. jugar el Ancestral con el riesgo de que no me salga carta azul; 3. jugar la Adivinación esquelética con la que robaría 4 cartas como máximo teniendo que remover las 4 del cementerio y pagar más vidas, pero en el caso de no salir carta azul, podría seguir teniendo un contrahechizo activo?

Los pagos/resultados et las probabilidades de la lotería se pueden representar de la forma siguiente (suponiendo que el mazo contenía 60 cartas y de éstas, 18 eran azules):

Es decir, en definitiva, la decisión sería jugar la Fuerza de Voluntad, el Ancestral Recall o la Adivinación Esquelética. Si jugamos la Fuerza de Voluntad, no importa si robaríamos carta azul o no, pues sencillamente no hay ni pérdida de vidas o pérdida de cartas en forma de removerlas del cementerio pero tampoco no tenemos ninguna ventaja de cartas. Así, ambos pagos/resultados serán iguales y tendrán una posición media: 5. Si jugamos el Ancestral Recall, el pago que se puede obtener es el máximo (de 10, concretamente) pues no hay pérdida de cartas o vidas, pero también puede ser el mínimo (de 0, precisamente) máxime por que si no hayamos carta azul, dejamos entrar el Juramento de los druidas y como el rival había jugado un Time Walk, activa seguro, poniéndose la partida muy cuesta arriba. Si jugamos la Adivinación Esquelética, podemos hallar la carta azul y obtener un resultado medianamente bueno (de 7,5, para ser concretos) o hallar cartas no azules obteniendo una resultado medianamente malo (de 2,5 para ser precisos), pues hay pérdida de vidas, se ha de remover cartas del cementerio y no hemos hallado la carta azul, pero que tenemos un contrahechizo aún activo.

En lo referente a las probabilidades, vemos que –haciendo uso de la básica regla de Laplace- la probabilidad de sacar, robando tres cartas, como mínimo una carta azul del deck es igual a uno menos la probabilidad de no sacar ninguna carta de la baraja que sea azul. Consecuentemente, la probabilidad de robar como mínimo una carta azul, robando tres cartas, es de 0,62 y la probabilidad de sacar una carta que no sea azul es de 0,38.

¡El panorama no puede ser más emocionante, estimado lector! Las loterías son las que siguen:

Lotería de la Fuerza de voluntad:

LF = { 1 / 5 }

Lotería del Ancestral Recall:

LA = { 0.62, 0.38 / 10, 0 }

Lotería de la Adivinación esquelética:

LS = { 0.73, 0.27 / 7.5, 2.5 }

Se puede vislumbrar que la estructura de una lotería es simple: la lotería del Ancestral Recall v.gr., distribuye las probabilidades (en el lado izquierdo de la raya vertical) y los pagos/resultados (en el lado derecho de la raya vertical). ¿Cómo se lee la lotería del Ancestral recall (LA)? La primera de las probabilidades (es decir, 0,62), tiene como resultado el primer pago/resultado del lado derecho (es decir, 10) y la segunda probabilidad, es decir la posterior a la primera (en este caso, 0,38), tiene como resultado el segundo pago/resultado del lado derecho (es decir, 0).

Así, el perspicaz lector se preguntará: pero Catulo, ¿qué criterios existen para comprar las loterías y por ende, saber cual de ellas es más óptima y así, saber que toma de postura escoger? La respuesta es que tenemos dos métodos que se deben seguir para tener la certeza sin ninguna incertidumbre que la decisión en una situación de incertidumbre con variables no controladas basadas en el azar, será optima. Los antedichos métodos son los que se enumeran:

El Valor esperado: el criterio del Valor esperado se basa en la suma de las probabilidades de cada pago/resultado por su pago/resultado respectivo. El uso de la herramienta es simple pero eficaz, como se muestra en el ejemplo siguiente: siguiendo con las loterías que teníamos en el ejemplo anterior, el Valor Esperado de cada una de ellas es:

E(LF) = 1*5 = 5

E(LA) = 0,62*10 + 0,38*(0) = 6,20

E(LS) = 0,73*7,5 + 0,27*(2,5) = 6,15

Vemos que el Valor Esperado (E(LA)) de jugar el Ancestral recall es estrictamente mayor al valor esperado de jugar la Adivinación esquelética y ésta es estrictamente mayor a jugar la Fuerza de Voluntad. Por ende, la decisión óptima en este contexto sería jugar el Ancestral recall.

El Teorema de la utilidad esperada: el Teorema de la utilidad esperada afirma que las personas no basan sus decisiones mediante el criterio del Valor esperado; así pues, se basa en la suma de probabilidades de cada pago/resultado por el valor que da la función de utilidad del individuo a cada pago/resultado respectivo. El uso es un poco más complejo, pero dentro del anillo de la simplicidad, siempre. Veamos su uso aplicándolo al ejemplo anterior. Supongamos que la función de utilidad del jugador 1 es: u(X) = raíz(X)

U(LF) = 1*raíz(5) = 2,24

U(LA) = 0,62*raíz(10) + 0,38*raíz(0) = 1,96

U(LS) = 0,73*raíz(7,5) + 0,27*raíz(2,5) = 2,43

Vemos que el Teorema de la utilidad esperada (U(LS)) indica que la decisión optima es jugar la Adivinación esquelética. ¿Por qué? La respuesta es por la aversión al riesgo del individuo. Si el jugador en cuestión tiene una función de utilidad como la propuesta no le gusta arriesgarse, no le gusta correr el peligro de no tener un contrahechizo activo y es por eso que escoge jugar la Adivinación esquelética. Lo que resulta mas que obvio, es que en estos dos contextos, una opción jamás preferida es la de jugar la Fuerza de voluntad, removiendo el Ancestral recall.

Así, resulta más que obvio que el valor final del Teorema de la utilidad esperada depende de la función de utilidad de cada jugador de Magic. Un jugador de Magic, según el susodicho teorema, se divide en tres tipos: los que tienen inclinación al riesgo, los que son neutrales al riesgo y los que tienen aversión al riesgo (como ha sido el caso propuesto). El atento lector se preguntará: ¿qué tipo de jugador soy yo para saber así mi función de utilidad que tengo y poder aplicar el Teorema de la utilidad esperada? La respuesta aunque interesante, es larga y por eso el lector podrá leer próximamente el articulo: “Información y jugadores tipo”.

El ejemplo propuesto ha consistido en decidir qué carta jugar, pero son múltiples las aplicaciones: desde decidir el turno en que tirarse a combar, a petar una fetch o esperar.

En conclusión, el presente artículo ha presentado la decisión eficiente y optima que debe tomar un jugador de Magic en contextos de certeza, con diversos ejemplos aplicados. También ha presentado las decisiones óptimas en contextos de incertidumbre con variables no controladas basadas en las leyes del azar (mediante el criterio del Valor esperado y el Teorema de la utilidad esperada), con diversos ejemplos aplicados.

Confío que les haya agradado esta primera parte del artículo. Espero que disfruten de un buen día. Saludos.

AAL
Barcelona

No hay comentarios: