icon Bienvenido a nuestros foros de poker, regístrate para acceder a todas las funciones.

» FOROS POQUER RED | Foros de poker » Sección póquer general » Póquer general » Introducción a las estadísticas detrás de la varianza

Póquer general Foro de charla general sobre poker online. Discute las últimas noticias de poker, consulta todas tus dudas a la comunidad de Póquer Red.

Respuesta
 
LinkBack Herramientas Desplegado
Antiguo 06-01-2008, 13:46:30   #1
Moderador
 
Avatar de spainfull
 
Fecha de Ingreso: Dec 2005
Mensajes: 1.863
Reputación: 1574
spainfull rompe la escala de la reputaciónspainfull rompe la escala de la reputaciónspainfull rompe la escala de la reputaciónspainfull rompe la escala de la reputaciónspainfull rompe la escala de la reputaciónspainfull rompe la escala de la reputaciónspainfull rompe la escala de la reputaciónspainfull rompe la escala de la reputaciónspainfull rompe la escala de la reputaciónspainfull rompe la escala de la reputaciónspainfull rompe la escala de la reputación
Predeterminado Introducción a las estadísticas detrás de la varianza

Este artículo es la traducción de un mensaje de holdem2000 en este hilo de los foros de 2+2. Su título original es " A primer on the statistics behind variance” y fue publicado el 12 de diciembre de 2007. MonJamon ya hizo una traducción de un artículo en el que se usaba una hoja Excel para calcular el rango de nuestro ratio de ganancias real. Pero he traducido éste porque creo que es un buen comienzo para todos aquellos que estén interesados en las matemáticas y en la estadística pero no se hayan atrevido a echarle un ojo por si resultara demasiado complicado. En el libro “Mathematics of Poker” aparece más o menos toda esta información entre otras muchas cosas. Ya se sabe, en esta vida, todo son numericos…

La idea para escribir este artículo vino tras un hilo en el que 1p0kerboy nos estábamos explicando de manera atropellada los mismos cálculos el uno al otro... mostrando parte de la información de manera un poco confusa. Aquí expreso todo esto de manera mucho más clara gracias a la discusión con 1p0kerboy.

En este mensaje voy a cubrir una serie de aplicaciones estadísticas para una mejor comprensión de la muestra de la varianza. Explicaré, asimismo, cómo usar la información obtenida de Poker Tracker para estimar intervalos en los que se encuentra el "verdadero" ratio de ganancias en un nivel dado de confianza. Antes de comenzar, voy a incluir un breve descargo de responsabilidad/rajada que es en realidad más un comentario técnico; puedes saltarte tranquilamente esta sección si no estás familiarizado de alguna forma con la idea de medir la varianza cuantitativamente y con la distribución normal... el resultado de este apartado es que las matemáticas que se mostrarán a continuación son una [probablemente ligera] estimación a la baja de la varianza real.

\comienzo rajada
La ganancia o pérdida de una mano de póquer es un valor aleatorio, pero con seguridad no es un valor normalmente distribuido. La distribución de las ganancias de la mano, sin embargo, tiene algún valor promedio. Así, el teorema del límite central nos asegura (siempre que el resultado de cada mano sea independiente e idénticamente distribuido) que, si consideramos muestras de la suma de ganancias de un número grande de manos, cada una de esas muestras es, de hecho, un resultado aleatorio normalmente distribuido.

Mientras un rango de 30 a 100 eventos tomados en conjunto es considerado normalmente suficiente para aplicar el teorema del límite central, las manos de póquer son un caso un poco más extremo, con eventos grandes (+/- 100 ciegas grandes) ocurriendo con una frecuencia tal que no creo que una muestra de 100 manos esté cercana a ser normalmente distribuida. La desviación estándar de la muestra de 100 manos proporcionada por el PT subestima la varianza verdadera. Por ejemplo, usando los números empleados más adelante en este artículo, la probabilidad de ganar 4 cajas (200PTBB) en 100 manos es 1 entre 5 millones.

Para concluir me gustaría destacar que, aunque las manos no son ni idénticamente distribuidas del todo (las distribuciones varían con la posición relativa al botón al menos) ni independientes (dependiendo de los rivales que tengamos, nos encontramos con series de manos con expectativa y varianza mayor o menor que la que tendríamos si jugáramos contra otro conjunto de rivales distinto). Estas variaciones de las asunciones del teorema del límite central conducen de nuevo a subestimar ligeramente la varianza total.
\fin rajada

Información de base
Antes de poder aplicar la información de este artículo, necesitas una estimación de tu ratio de ganancias, el número de manos total sobre la que está medido y un cálculo de la desviación estándar o varianza de tu ratio de ganancias para la muestra escogida. En PT, los dos primeros datos se encuentran en la pestaña "General Info.". Para obtener la desviación estándar es preciso seleccionar la pestaña "Session Notes", pulsar en "More detail..." y, en la ventana emergente, el texto en blanco que contiene "Standard Deviation/100 Hands:", que lo lista como una cantidad en $ y en ciegas grandes. Debería estar en un rango de 20 a 200 ciegas grandes, dependiendo del estilo de juego y del tipo de mesas en las que juegues.

Voy a asumir que ya sabes lo que significa el ratio de ganancias; hay que tener en cuenta que como normalmente se mide es en BB/100, siendo BB el acrónimo para ciegas grandes o apuestas grandes (dos veces la ciega grande). La última es la más estándar (a pesar de que tiene menos sentido para NL/PL) y es la que utilizaré en los cálculos (en adelante, escribiré ptBB/100 para indicar apuestas grandes del PokerTracker). Para cambiar el valor con el que PT muestra las estadísticas de ganancias, basta con ir a la pestaña "Preferences" y en la parte derecha en el centro de la pantalla, marca o desmarca “treat ‘BB’ For NL/PL As Big Blind Amt.” (se encuentra debajo del botón “Custom Levels…”.

La desviación estándar (SD) proporcionada por PT indica la SD de una muestra de 100 manos. La SD es una medida de la variación sobre el resultado medio -cuanto mayor sea la desviación estándar, más probable es que una muestra aleatoria de 100 manos se desvíe en mayor medida del ratio medio de ganancias-. Para números grandes de manos, asumiremos que las ganancias siguen una distribución normal. Las probabilidades basadas en una distribución normal son bien conocidas, emplearemos una tabla de distribución normal tipificada (aquí hay una) para calcular las probabilidades de varios resultados de variables aleatorias normalmente distribuidas.

Una introducción rápida a la distribución normal
Pongamos que las ganancias en cada una de las muestras de 100 manos están normalmente distribuidas con, por ejemplo, un beneficio medio de $15 y una desviación estándar de $100. Esto quiere decir que, cuando se jueguen 100 manos, aproximadamente el 68% de las veces las ganancias serán $15 +/- $100; es decir, entre -$85 y +$115. Del mismo modo, el 95% de las veces las ganancias serán $15 +- 2*($100); o lo que es lo mismo, entre -$185 y +$215. Y el 99,7% de las veces las ganancias serán $15 +/- 3*($100); o sea, entre -$285 y +$315. Conociendo la media y la SD de cada una de las muestras de 100 manos, se puede usar una tabla de distribución normal tipificada para calcular la probabilidad de que las ganancias de una muestra de 100 manos se hallen dentro de un intervalo dado (de aquí vienen los porcentajes 68, 95 y 99.7... más adelante en este artículo explicaré cómo puedes calcular este tipo de cosas tú mismo).

La cuestión es que no sabemos realmente cuál es nuestro verdadero ratio de ganancias. Si jugamos 100 manos y ganamos $15, podemos suponer que es de $15 cada 100 manos, pero en lugar de hacer una suposición como esta, sería mejor saber cómo es de probable que nuestro ratio real de ganancias se acerque a esta suposición. Si por casualidad conociéramos nuestra SD verdadera, podríamos construir intervalos de confianza... Asumamos que nuestra SD real es $100 cada 100 manos. Entonces un intervalo de confianza del 68% sería (-$85, +$115), un intervalo de confianza del 95% sería -$185, +$215, y así sucesivamente (estos intervalos son tan amplios porque 100 manos es, desgraciadamente, una muestra ridículamente pequeña). Un detalle importante a señalar es que el nivel de confianza (68%, 95%, etc.) NO es la probabilidad de que nuestro verdadero ratio de ganancias se encuentre en el intervalo calculado. Este tipo de probabilidad es imposible de conocer sin hacer asunciones mucho más complicadas y sin incluir un conocimiento más profundo de base. Lo que un 68% de intervalo de confianza de -$85, +$115 nos indica es que, si nuestro ratio real de ganancias fuera menor de -$85 cada 100 manos (o mayor de +$115 cada 100 manos), entonces en cualquier muestra de 100 manos dada, tener un resultado tan bueno como +$15 (o tan malo como -$15) ocurriría menos del 32% de las veces (100% - 68% = 32%).

Cálculos
La SD de cada una de nuestras muestras de 100 manos es algo que converge mucho más deprisa que nuestro ratio de ganancias y, tras un número relativamente pequeño de manos (por supuesto, hablamos de al menos miles de manos si queremos un dato fiable), podemos asumir que la SD proporcionada por PT es una muy buena aproximación de nuestra "verdadera" SD cada 100 manos.

A continuación, nos gustaría conocer la SD de nuestra muestra completa de manos... por ejemplo, vamos a poner que hemos jugado 138.200 manos y el PT nos dice que nuestra SD para cada muestra de 100 manos es de 38,8439 ptBB. Aquellos que no estén interesados en el razonamiento de los cálculos pueden saltar directamente al texto en negrita. Como nuestra muestra de138.200 manos es la suma de 1.382 muestras de 100 manos, la manera intuitiva de obtener el resultado sería coger la SD de 34,8439 y multiplicarla por 1.382... La SD no se calcula de esta manera "aditiva". Pero la varianza de nuestras muestras sí tiene esta propiedad. La varianza es, por definición, el cuadrado de la SD.

Así, la varianza de una muestra de 100 manos es igual a (38,8439)^2 = 1.508,85 (ptBB^2). La varianza de nuestra muestra completa de 138.200 manos es, entonces, igual a 1.382*1.508,85 = 2.085.230 (ptBB^2). Ahora podemos calcular la raíz cuadrada de este número para hallar la SD de la muestra completa: SD = sqrt(2.085.230) = 1444,03 ptBB.

Debido al hecho de que el ratio de ganancias se mide en ptBB/100, estaría mucho mejor si calculáramos la SD de la muestra en esa misma unidad. Nuestra SD de 1.444,03 ptBB está calculada sobre 138.200 manos, así que, cambiando la unidad, tenemos: SD = 1.444,03 / 1.382 = 1,045 ptBB/100.

Como atajo, se puede recordar que la SD (en ptBB) de la muestra de 138.200 manos, es igual a la SD de la muestra de 100 manos sqrt(1.382) veces y, si en lugar de eso, la queremos en ptBB/100, hay que coger la SD de la muestra de 100 manos y dividirla por sqrt(1.382):
SD = 38,8439 * sqrt(1.382) = 1.444,03 ptBB
SD = 38,8439 / sqrt(1.382) = 1,045 ptBB/100


Ahora estamos preparados para medir con precisión el error de la estimación de nuestro ratio de ganancias. Supongamos que en la muestra de 138.200 manos hemos ganado un total de 4.422,4 ptBB o, lo que es lo mismo, un ratio de ganancias de: 4.422,4 / 1.382 = 3,2 ptBB/100. Hemos calculado que la SD de esta muestra de 138.200 manos es 1,045 ptBB/100, así, un intervalo de confianza del 68% para nuestro ratio de ganancias es (3,2 +/- 1,045) ptBB/100, un intervalo de confianza del 95% es (3,2 +/- 2*1,045) ptBB/100, y así sucesivamente. Puedes hacerte una buena idea de tu verdadero ratio de ganancias simplemente recordando que puedes calcular un intervalo de confianza del 95% para tu ratio real de ganancias, sumando o restando a tu ratio de ganancias el doble de la SD (en ptBB/100) calculada.

El resto del artículo precisa de la utilización de una tabla de distribución normal tipificada. Si queremos encontrar un intervalo de confianza del 98%, debemos mirar cuántas SD nos tenemos que desviar desde la media en cada dirección para incluir el 98 de la distribución normal. Normalmente, cuando encontramos un intervalo de confianza del 98%, querríamos que el 2% de la distribución que no incluimos se dividiera equitativamente - el 1% de los valores más altos y el 1% de los valores más bajos-. De esta forma, deberíamos mirar en la tabla de distribución normal tipificada cuántas SD por encima de la media debemos estar para que quede solamente el 1% de la distribución; por ejemplo, buscamos el valor Z que marca .99 en la tabla. Este valor es 2,33 (y -2,33 es el valor Z con únicamente el 1% de la distribución normal por debajo de él), así que, siguiendo con nuestro ejemplo, un intervalo de confianza del 98% para nuestro verdadero ratio de ganancias es (3,2 +/- 2,33*1,045) ptBB/100.

Ahora echemos un ojo a un problema similar. Queremos encontrar para qué nivel de confianza podemos estar seguros de que somos un jugador ganador. Básicamente lo que queremos saber es nuestro nivel de confianza en el intervalo (0, infinito). Las cantidades a encontrar son para las que la distribución normal con media 3,2 y SD 1,045 se sitúan por encima del valor 0. Para hacer esto, hay que calcular cuántas SD 0 se aleja de 3,2:
(3,2 – 0) / 1,045 = 3,062 SD.
Usando una tabla de distribución normal tipificada, hallamos que la media solo incluye el 0,11% de los datos, así podemos concluir que tenemos un nivel de confianza del 99,89% de que nuestro ratio de ganancias es positivo.

Si quisiéramos hallar el nivel de confianza en un intervalo arbitrario, pongamos (X, Y), haríamos lo mismo: usaríamos una tabla de distribución normal tipificada para calcular cuánto de la distribución normal está por debajo de X y cuánto por encima de Y; si el 10% está por debajo de X y el 20% por encima de Y, entonces (X, Y) es un intervalo de confianza del 70% (100% - 10% - 20%).

Para aquellos que tengan previsto hacer cálculos similares de forma habitual, recomiendo familiarizarse con las funciones de Excel, NormInv y NormDist, que evitarán usar una tabla de distribución normal tipificada y permitirá encontrar valores con una mayor precisión.
_______
Para el que haya encontrado interesante el artículo, un enlace en el que se discute por qué no es correcto el cálculo que hace PT de la SD y por qué no sigue una distribución normal (principalmente por Pokey). Otro, a raíz del anterior sobre la varianza y si sigue una distribución normal en muestras de 1000 manos.
__________________
¿Póquer? Póquer yo lo valgo.
Estrategia NL NO LIMITs LOSER.
Listado de mis artículos semanales en póquer red.

Última edición por spainfull fecha: 06-01-2008 a las 13:55:46.
spainfull is offline  
Responder Con Cita
Antiguo 06-01-2008, 14:27:30   #2
Banned
 
Fecha de Ingreso: Sep 2007
Mensajes: 67
Reputación: 10
CHANKUMAN está en el buen camino
Predeterminado Re: Introducción a las estadísticas detrás de la varianza

Muchas gracias se agradecen aportaciones de este tipo
CHANKUMAN is offline   Responder Con Cita
Antiguo 06-01-2008, 16:12:18   #3
Banned
 
Fecha de Ingreso: Jan 2007
Mensajes: 274
Reputación: 53
MuckeDBoY infunde respeto
Predeterminado Re: Introducción a las estadísticas detrás de la varianza

Pero si no lo has leido mentiroso :P
MuckeDBoY is offline   Responder Con Cita
Antiguo 06-01-2008, 18:12:13   #4
Tiburón
 
Avatar de Klaudioz
 
Fecha de Ingreso: Jul 2006
Mensajes: 1.814
Reputación: 116
Klaudioz es una joya en el caminoKlaudioz es una joya en el camino
Contactar con Klaudioz a través de MSN
Predeterminado Re: Introducción a las estadísticas detrás de la varianza

Gran aporte ¡¡

Yo hace un tiempo hice un tema de como calcular estos datos con hartos graficos en Excel, ahi va: ¿Cuantas manos necesito para saber que soy un ganador en el Poker?. Parte I

Cuando tenga tiempo para leer el mathematics of Poker, espero hacer otras cosas parecidas.
__________________
http://poker.klaudioz.com , no se olviden :P (en nuevo host mas rapido)
Klaudioz is offline   Responder Con Cita
Antiguo 07-01-2008, 14:52:21   #5
Miembro junior
 
Avatar de cartapel
 
Fecha de Ingreso: Oct 2006
Mensajes: 42
Reputación: 10
cartapel está en el buen camino
Predeterminado Re: Introducción a las estadísticas detrás de la varianza

Yo recomendaría jugar con la Distribución Binomial. Ahí puedes ver con todo detalle la varianza para la apuesta que quieras. Yo me fijo especialmente para las de botes gordos, que son las que más bamboleos le dan a los resultados.
cartapel is offline   Responder Con Cita
Antiguo 09-01-2008, 21:26:20   #6
Moderador
 
Avatar de spainfull
 
Fecha de Ingreso: Dec 2005
Mensajes: 1.863
Reputación: 1574
spainfull rompe la escala de la reputaciónspainfull rompe la escala de la reputaciónspainfull rompe la escala de la reputaciónspainfull rompe la escala de la reputaciónspainfull rompe la escala de la reputaciónspainfull rompe la escala de la reputaciónspainfull rompe la escala de la reputaciónspainfull rompe la escala de la reputaciónspainfull rompe la escala de la reputaciónspainfull rompe la escala de la reputaciónspainfull rompe la escala de la reputación
Predeterminado Re: Introducción a las estadísticas detrás de la varianza

Cita:
Empezado por cartapel Ver Mensaje
Yo recomendaría jugar con la Distribución Binomial. Ahí puedes ver con todo detalle la varianza para la apuesta que quieras. Yo me fijo especialmente para las de botes gordos, que son las que más bamboleos le dan a los resultados.
no entiendo, ¿podrías explicar un poco más? Yo no soy un experto en estadística, pero entiendo que la probabilidad del éxito no es constante entre sucesos de la muestra, ¿no? (ni los sucesos son independientes uno del otro en realidad).
__________________
¿Póquer? Póquer yo lo valgo.
Estrategia NL NO LIMITs LOSER.
Listado de mis artículos semanales en póquer red.
spainfull is offline   Responder Con Cita
Antiguo 10-04-2008, 16:11:25   #7
Miembro distinguido
 
Fecha de Ingreso: Feb 2008
Mensajes: 390
Reputación: 270
corpcd es más majo que un atúncorpcd es más majo que un atúncorpcd es más majo que un atún
Predeterminado Re: Introducción a las estadísticas detrás de la varianza

Cita:
Empezado por spainfull Ver Mensaje
no entiendo, ¿podrías explicar un poco más? Yo no soy un experto en estadística, pero entiendo que la probabilidad del éxito no es constante entre sucesos de la muestra, ¿no? (ni los sucesos son independientes uno del otro en realidad).
Si, son independientes. Pero a ver si tengo un rato, me leo el articulo en profundidad y respondo con mas criterio...

corp
corpcd is offline   Responder Con Cita
Antiguo 10-04-2008, 16:51:43   #8
Miembro distinguido
 
Avatar de trepaclimb
 
Fecha de Ingreso: Oct 2007
Mensajes: 360
Reputación: 75
trepaclimb infunde respeto
Predeterminado Re: Introducción a las estadísticas detrás de la varianza

Excelente aportación, a ver si después de rellerlo un par de veces lo asimilo bien...
trepaclimb is offline   Responder Con Cita
Antiguo 10-04-2008, 17:08:37   #9
Miembro distinguido
 
Avatar de trepaclimb
 
Fecha de Ingreso: Oct 2007
Mensajes: 360
Reputación: 75
trepaclimb infunde respeto
Predeterminado Re: Introducción a las estadísticas detrás de la varianza

No me deja editar así que tengo que poner otro post...

Será una pregunta súper chorra seguramente, pero... ¿para qué sirve saber la SD para saber si soy un ganador en determinado nivel, si tienes un BB/100 positivo? osea, quiero decir, ¿es posible tener un +2BB/100 y perder dinero a largo plazo teniendo la SD que sea?
trepaclimb is offline   Responder Con Cita
Antiguo 10-04-2008, 17:18:28   #10
Miembro distinguido
 
Fecha de Ingreso: Feb 2008
Mensajes: 390
Reputación: 270
corpcd es más majo que un atúncorpcd es más majo que un atúncorpcd es más majo que un atún
Predeterminado Re: Introducción a las estadísticas detrás de la varianza

Cita:
Empezado por trepaclimb Ver Mensaje
Será una pregunta súper chorra seguramente, pero... ¿para qué sirve saber la SD para saber si soy un ganador en determinado nivel, si tienes un BB/100 positivo? osea, quiero decir, ¿es posible tener un +2BB/100 y perder dinero a largo plazo teniendo la SD que sea?
Lo que calculas es tu CONFIANZA como jugador ganador. O de otro modo, la confianza de que tengas ganancias, y no perdidas.

Un jugador ganador al 68% es un buen jugador, a largo plazo, es dificil que tenga perdidas. De cada 100 veces que el jugador se ponga a jugar, en 68 de ellas tendra ganancias, y el resto, perdidas.

Un ganador al 90% es muy dificil que tengas saldos negativos. Uno al 50%, pues cada dos veces, tendra perdidas.

Un individuo puede haber tenido ganancias hasta ahora, pero al tener mucha varianza a largo plazo puede ser que pierda.

He leido el articulo, y una de dos, o el usuario que ha mencionado la distribucion binomial no se ha leido el articulo entero, o esa distribucion la aplica a cualquier otra cosa que no tiene nada que ver con el mismo.

Por cierto, el articulo hace algunas afirmaciones que no se realmente de donde las saca, y tengo que ver que es la SD para el Poker Tracker, para asegurar que los calculos estan bien.

corp
corpcd is offline   Responder Con Cita
Respuesta


Usuarios activos actualmente viendo este tema: 1 (0 miembros y 1 visitantes)
 
Herramientas
Desplegado

Normas de Publicación
You may not post new threads
You may not post replies
You may not post attachments
You may not edit your posts

BB code is habilitado
Las caritas están habilitado
Código [IMG] está habilitado
Código HTML está deshabilitado
Trackbacks are deshabilitado
Pingbacks are habilitado
Refbacks are habilitado
Saltar a Foro

Temas Similares
Tema Autor Foro Respuestas Último mensaje
te estoy viendo las cartas dansoaz Póquer general 13 17-03-2008 12:39:39
Shorthand (parte I de III) articulo tremeeeendaaamente largo kulyn No Limit Fullring 11 25-11-2007 13:52:34
El BoOom del Poker y sus Secretos! Jesusitonsky 2ª Edición 7 24-11-2007 01:59:12
Habrá que aceptar las cosas MonJamon Limit 27 22-06-2006 14:11:27
Las locas aventuras de ibon ¡Mision Peralada! ibon87 Torneos 18 05-05-2006 17:56:57