icon Bienvenido a nuestros foros de poker, regístrate para acceder a todas las funciones.

» FOROS POQUER RED | Foros de poker » Sección póquer general » Póquer general » "Comprendiendo la teoría de juegos y el hold'em", por Bryce Paradis and Douglas Zare

Póquer general Foro de charla general sobre poker online. Discute las últimas noticias de poker, consulta todas tus dudas a la comunidad de Póquer Red.

Respuesta
 
LinkBack Herramientas Desplegado
Antiguo 01-10-2008, 00:03:29   #1
Moderador
 
Avatar de Sergeon
 
Fecha de Ingreso: Jan 2007
Mensajes: 1.659
Reputación: 1279
Sergeon rompe la escala de la reputaciónSergeon rompe la escala de la reputaciónSergeon rompe la escala de la reputaciónSergeon rompe la escala de la reputaciónSergeon rompe la escala de la reputaciónSergeon rompe la escala de la reputaciónSergeon rompe la escala de la reputaciónSergeon rompe la escala de la reputaciónSergeon rompe la escala de la reputación
Predeterminado "Comprendiendo la teoría de juegos y el hold'em", por Bryce Paradis and Douglas Zare

(traducción de este post de 2+2 sobre teoría de juegos, que encontré vía el estupendo blog de Itsuga. Que lo disfruteís.)

La teoría de juegos se ha convertido en una tema típico, aunque bastante mal comprendido, en las discusiones sobre hold'em. Este artículo pretende ofrecer una comprensión fundamental de qué es una estrategia óptíma de teoría de juegos, cómo funciona y qué impacto tiene en un juego como el hold'em. Pero antes de empezar el artículo en sí, vamos a ver una serie de definiciones clave. Éstas no tienen por qué ser idénticas a las usadas por otros autores.

Estrategia explotadora óptima: Una estrategia que consigue el mayor valor esperado contra la estrategia dada de un oponente. Por ejemplo, en un juego de piedra-papel-o-tijera, si la estrategia de tu oponente es elegir "piedra" todas las veces, tu estrategia explotadora óptima es elegir papel en todos los casos. Esto también es así si la estrategia de tu oponente consiste en un 50% de piedra, un 25% de papel y un 25% de tijeras.

Estrategia subóptima: Es una estrategia que funciona peor que una estrategia explotadora óptima. Por ejemplo, si la estrategia de tu oponente es elegir piedra todas las veces, elegir un 50% de papel y un 50% de piedra es aún una estrategia ganadora. Su valor esperado, sin embargo, es menor que el de una estrategia de sólo papel. Por tanto, la estrategia de piedra-y-papel es subóptima.

Estrategia óptima de teoría de juegos (a partir de ahora, " estrategia GTO" -por "game theory optimal strategy"): Es la estrategia que consigue el mayor EV si tu oponente elige la mejor contraestrategia posible. En un juego de piedra-papel-o-tijera, la estrategia GTO es elegir al azar entre una distribución igual de piedra, papel y tijera. Si juegas menos veces piedra que papel, tendrás una expectativa de victoria menor de 1/2 contra todas las estrategias donde la tijera es dominante. Por tanto, debes jugar al menos tantas veces piedra como papel, y del mismo modo tantas tijeras como piedras. Por tanto, como resultado, obtenemos que debes jugar una cantidad igual de piedra, papel y tijera para garantizar una expectativa de 1/2 contra todas las posibiles contra-estrategias. Si tu oponente elige siempre la mejor contraestrategia posible, ninguna estrategia te garantizará más EV que esta.


Estrategia explotadora: Cualquier estrategia que tenga un valor esperado mayor que la estrategia GTO contra una estrategia determinada de un oponente.


Estrategia explotable: Una estrategia que tiene menos EV contra algunas estrategias explotadores del que tendría una estrategia GTO. Todas las estrategias no-GTO son explotables.


Cuando analizamos estrategias explotadoras óptimas, tratamos la estrategia del oponente como si fuese, de hecho, conocida. Por ejemplo: "mi oponente siempre elige piedra". En realdad, la estrategia de nuestro oponente es desconocida, y nosotros siempre decidimos esto en base a asunciones y observaciones para determinar qué tipo de estrategia nuestro oponente puede tener. Para determinar una estrategia GTO, asumimos que el oponente siempre elige la contra-estrategia explotadora óptima contra cualquier posible estrategia que intentemos plantear, y no un juego mixto.
El hold'em es un juego mucho más complicado que el piedra-papel-o-tijera, y hasta que el juego no sea resuelto por los ordenadores, nadie jugará contra un oponente que elija siempre una estrategia GTO (es decir, "inexplotable"). Esto es un asunto importante, porque una estrategia GTO no es necesariamente la que tiene el mayor EV. Por ejemplo, si un oponente tiene una estrategia de sólo-piedra, la estrategia GTO de elegir al azar entre una distribución igual de piedra, papel y tijera tiene menos EV que una de sólo-papel.


El juego óptimo no explotable, sin embargo, juega de todos modos un importante papel en la estrategia del hold'em. Si bien esta estrategia GTO puede realizar menos valor esperado que una estrategia explotadora, entender qué es la estrategia GTO e identificar cómo las estrategias de tus oponentes se desvían de ella te puede ayudar a explotar mejor a tus oponentes. Además, entender la estrategia GTO permite también desarrollar líneas difíciles de explotar, que se pueden usar como defensa contra oponentes muy duros que busquen un edge intentando explotar tu juego.
En hold'em, como en muchos otros juegos (al igual que el piedra-papel-o-tijera), una estrategia GTO es identificable buscando un punto de indiferencia. Lo que esto quiere decir es que la estrategia GTO distribuirá generalmente tus acciones de tal manera que a tu oponente le será indiferente elegir entre dos acciones. El resultado de ello es que tu estrategia es inexplotable.


Aunque el hold'em no ha sido resuelto aún, muchos mini-juegos a media calle o a una calle entera que modelan situaciones reales de hold'em sí han sido resueltos. Entendiendo cómo funcionan los puntos de indiferencia en diferentes escenarios posibles, puedes detectar desviaciones de la estrategia de tus oponentes respecto de una estrategia GTO, y así encontrar la manera de maximizar tu margen sobre esa estrategia y explotarla.
Un ejemplo claro de minijuego a media calle, sería un juego en el que tenemos una mano tal que sabemos que siempre ganará o que siempre perderá cuando veamos un showdown, y podemos apostar o pasar, y nuestro oponente puede solamente elegir entre igualar o pasar. Si iguala, hay un showdown. Esto es con cierta frecuencia lo que se puede dar en una partida real de hold'em, si en el river el rango de nuestro oponente es muy restringido y el nuestro está muy polarizado. Si resolvemos el minijuego, veremos que la estrategia GTO consiste en farolear una cantidad de veces[1] proporcional al precio que le consentimos al oponente con su call. Por ejemplo, si apostamos 1$ en un bote de 2$, le estamos ofreciendo unas odds de 3:1, así es que la estrategia GTO consistirá en farolear un 25% de las veces que apostamos. Esto quiere decir que, si nos desviamos de esta estrategia, nuestro oponente nos puede explotar igualando siempre si faroleamos más, o tirando siempre las cartas si faroleamos por debajo del punto de indiferencia.


No todas las decisiones de teoría de juegos tienen que ver con buscar puntos de indiferencia. Por ejemplo, si estamos jugando una variante del piedra-papel-o-tijera con una cuarta opción, "dinamita", que gana a todas las demás, la estrategia GTO es elegir sólo dinamita. Tu oponente puede, de todos modos, elegir una estrategia dominada eligiendo papel, tijeras, o roca [2]. Una situación similar se da en el hold'em, cuando las nuts son una porción tan grande de nuestro rango que es imposible farolear tanto como para que al oponente le sea indiferente igualar o tirar su mano.
Lo que esto significa es que mientras que una estrategia GTO no puede nunca jamás ser explotable, lo que supone que no será nunca una estrategia perdedora (en un juego libre de rake), tus oponentes pueden de todos modos tomar estrategias dominadas, que les llevarán a perder y a tí a ganar. Por consiguiente, si bien las estrategias GTO suelen ser subóptimas en el hold'em, la perspectiva de obtener una de estas "estrategias invencibles" tiene consecuencias interesantes para cualquier estudiante avezado de la teoría de juegos, especialmente en los high stakes.
Un oponente duro solalmente es duro, al fin y al cabo, porque él o ella elige unas pocas líneas subóptimas menos que un oponente más blando. Un jugador extraordinariamente bueno tendrá una enorme capacidad para realizar un juego dinámico. Si eliges una estrategia de sólo-roca, él o ella lo reconocerá rápido y jugará sólo-papel, y así en cada caso. Este tipo de jugadores identifican muy rapidamente tendencias en tu juego, incluso llegando a hacer asunciones preventivas sobre cómo puede variar tu juego, que les permitirán explotar tus estrategias sub-óptimas con una frecuencia y una precisión realmente molesta.
Es atractivo pensar que, por elegir una estrategia GTO, nuestros oponentes pueden solamente perder. De todos modos, incluso los oponentes más fuertes tienen estrategias explotadoras -y por tanto explotables- en su juego, y a fin de cuentas el hold'em es un juego de información incompleta. Si juegas contra un oponente extraordianariamente bueno como para jugar una estrategia equivalente a elegir un 33% de papel, un 20% de tijeras y un 47% de piedra, sería una estupidez intentar una estrategia de sólo papel. pero entendiendo dónde cae el punto de indiferencia, y desviándonos un poco de él, podemos jugar explotadoramente. Incluso el más duro y curtido de los jugadores no tiene el don de la clarividencia, así que si eliges una estrategia de 40% papel, 30% tijeras y 30% piedras: ¿Cómo va a hacer para adivinarlo?




[1] Es decir, la cantidad de la apuesta es fija y está dada por las reglas del juego. Lo que varía es, en función de esta cantidad, nuestro % de faroles en ese spot (nota mía).

[2] En cierto modo, al oponente le es indiferente elegir entre cualquier estrategia. El punto es que, elija lo que elija, su estrategia será perdedora, mientras que en el primer caso adpotar una estrategia GTO suponía que, aunque éramos inexplotables, nuestra estrategia no podía explotar al oponente (como en el caso de elegir al azar entre una distribucion igual de piedra, papel, o tijera. A donde el artículo quiere llegar después es que en hold'em puede haber situaciones donde hay estrategias óptimas que, si el oponente es suicientemente malo, son explotadoras (aunque no por ello tienen por qué tener la mejor EV).
__________________
Unlimited: Pues estaís en medio del mar...

Nepundo: ¡Pero dale al zoom, gilipollas!

Proffessional no limit google maps, Crónicas valencianas I



Visita Póquer para gambiteros, Vicentín lo haría :-P
Sergeon is online now  
Compartir
Responder Con Cita
Antiguo 01-10-2008, 00:35:04   #2
Moderador honorario
 
Avatar de spainfull
 
Fecha de Ingreso: Dec 2005
Mensajes: 2.145
Reputación: 1810
spainfull rompe la escala de la reputaciónspainfull rompe la escala de la reputaciónspainfull rompe la escala de la reputaciónspainfull rompe la escala de la reputaciónspainfull rompe la escala de la reputaciónspainfull rompe la escala de la reputaciónspainfull rompe la escala de la reputaciónspainfull rompe la escala de la reputaciónspainfull rompe la escala de la reputaciónspainfull rompe la escala de la reputaciónspainfull rompe la escala de la reputación
Predeterminado Re: "Comprendiendo la teoría de juegos y el hold'em", por Bryce Paradis and Douglas Zare

gran curro, gracias por el artículo.
__________________
¿Póquer? Póquer yo lo valgo.
Estrategia NL NO LIMITs LOSER.
Listado de mis artículos semanales en póquer red.
spainfull is offline  
Compartir
Responder Con Cita
Antiguo 01-10-2008, 03:33:02   #3
Miembro senior
 
Avatar de Th. Adorno
 
Fecha de Ingreso: Apr 2008
Mensajes: 61
Reputación: 43
Th. Adorno tiene carisma
Predeterminado Re: "Comprendiendo la teoría de juegos y el hold'em", por Bryce Paradis and Douglas Zare

Ja! Me encontraba traduciendo el artículo para mi carpeta de recursos..., googleé GTO en español..., y me trajo la traducción completa!!!
Gracias por el aporte. A ver si el próximo puedo devolver el favor!
Saludos.
Th. Adorno is offline  
Compartir
Responder Con Cita
Antiguo 01-10-2008, 03:36:28   #4
Moderador
 
Avatar de Sergeon
 
Fecha de Ingreso: Jan 2007
Mensajes: 1.659
Reputación: 1279
Sergeon rompe la escala de la reputaciónSergeon rompe la escala de la reputaciónSergeon rompe la escala de la reputaciónSergeon rompe la escala de la reputaciónSergeon rompe la escala de la reputaciónSergeon rompe la escala de la reputaciónSergeon rompe la escala de la reputaciónSergeon rompe la escala de la reputaciónSergeon rompe la escala de la reputación
Predeterminado Re: "Comprendiendo la teoría de juegos y el hold'em", por Bryce Paradis and Douglas Zare

lol, qué curioso. Espero que no llevases mucho...
__________________
Unlimited: Pues estaís en medio del mar...

Nepundo: ¡Pero dale al zoom, gilipollas!

Proffessional no limit google maps, Crónicas valencianas I



Visita Póquer para gambiteros, Vicentín lo haría :-P
Sergeon is online now  
Compartir
Responder Con Cita
Antiguo 07-10-2008, 23:34:26   #5
Tiburón
 
Avatar de haroldmk
 
Fecha de Ingreso: Sep 2006
Mensajes: 1.883
Reputación: 1035
haroldmk tiene un brillante futuroharoldmk tiene un brillante futuroharoldmk tiene un brillante futuroharoldmk tiene un brillante futuroharoldmk tiene un brillante futuroharoldmk tiene un brillante futuroharoldmk tiene un brillante futuroharoldmk tiene un brillante futuro
Contactar con haroldmk a través de MSN
Predeterminado Re: "Comprendiendo la teoría de juegos y el hold'em", por Bryce Paradis and Douglas Zare

Muy buen artículo y traducción. Muchas gracias por tomarte la molestia. Reputado estás.
__________________
La "pura vida" es más importante que el dinero.
Visita mis artículos de poquer-red
Matemática no tan básica del póquer en mi blog
haroldmk is offline  
Compartir
Responder Con Cita
Antiguo 09-10-2008, 00:15:47   #6
Miembro distinguido
 
Avatar de itsuga
 
Fecha de Ingreso: Aug 2006
Mensajes: 367
Reputación: 383
itsuga es un nombre que debéis conoceritsuga es un nombre que debéis conoceritsuga es un nombre que debéis conoceritsuga es un nombre que debéis conocer
Predeterminado Re: "Comprendiendo la teoría de juegos y el hold'em", por Bryce Paradis and Douglas Zare

Gracias por la traducción Sergeon.
Un saludo.
__________________
itsuga is offline  
Compartir
Responder Con Cita
Antiguo 09-10-2008, 00:20:57   #7
Tiburón
 
Fecha de Ingreso: Jul 2008
Mensajes: 571
Reputación: 260
Lonebar es más majo que un atúnLonebar es más majo que un atúnLonebar es más majo que un atún
Predeterminado Re: "Comprendiendo la teoría de juegos y el hold'em", por Bryce Paradis and Douglas Zare

Thx por el curro y está muy bien el artículo!

Saludos!
Lonebar is offline  
Compartir
Responder Con Cita
Antiguo 09-10-2008, 00:56:14   #8
Tiburón
 
Avatar de brokenman
 
Fecha de Ingreso: Dec 2007
Mensajes: 1.959
Reputación: 1350
brokenman rompe la escala de la reputaciónbrokenman rompe la escala de la reputaciónbrokenman rompe la escala de la reputaciónbrokenman rompe la escala de la reputaciónbrokenman rompe la escala de la reputaciónbrokenman rompe la escala de la reputaciónbrokenman rompe la escala de la reputaciónbrokenman rompe la escala de la reputaciónbrokenman rompe la escala de la reputaciónbrokenman rompe la escala de la reputación
Contactar con brokenman a través de MSN
Predeterminado Re: "Comprendiendo la teoría de juegos y el hold'em", por Bryce Paradis and Douglas Zare

Buena, niño, y deja mis putas ciegas.
__________________
www.desperdiciatuvida.com (mi blogocosa)

Ese es tu rango? Un zurullo dibujado?

Mr Jose Says: "Check behind the raise en flop........cash out en turn del 100% del bank del villano,y ya aprovechando la carrerilla le hacemos shove de cara con su propio bank en river y como no tiene dinero para cubrir la apuesta,hara fold.Ademas al final le gritamos a la cara a lo Paul Newman:"A una partida de poker se viene con dinero!!!""
brokenman is offline  
Compartir
Responder Con Cita
Respuesta


Usuarios activos actualmente viendo este tema: 1 (0 miembros y 1 visitantes)
 
Herramientas
Desplegado

Normas de Publicación
You may not post new threads
You may not post replies
You may not post attachments
You may not edit your posts

BB code is habilitado
Las caritas están habilitado
Código [IMG] está habilitado
Código HTML está deshabilitado
Trackbacks are deshabilitado
Pingbacks are habilitado
Refbacks are habilitado
Saltar a Foro