Valor esperado para SB y BB en NL HU (GTO)

Consideremos un NL HU Match 100BB de profundidad (sin rake). Ambos jugadores están jugando GTO (óptimo teórico del juego).

Supongamos que en la estrategia GTO el SB abre limps o abre r veces y abre folds f veces, con f + r = 1. r_ev es la parte del bote inicial de 1.5BB que el sb gana cuando r.

r_ev <= 1.

Además, supongo que comúnmente se exceptúa que el SB tiene una expectativa positiva. Por lo tanto: 0 < ev_sb = -ev_bb = -0.5 * f + r * r_ev * 1.5 ev_sb <= 1 (dado que la ciega pequeña puede ganar desde una perspectiva GTO como máximo 1bb de BB)

Obtenemos: r >= 0.3333; r_ev >= 0.3333

¿Existen límites más conocidos para los valores introducidos?

Respuestas (3)

No creo que nada esté probado, ni siquiera que ev_sb >= 0, por lo que los únicos límites que tenemos son triviales: -0.5 <= ev_sb <= 1.

Una pregunta más fácil es "¿Qué ev_sb encuentra la gente al resolver versiones abstractas de HUNLHE". Sería interesante saber el tipo de valores que recibe la gente, es decir,

1) El valor del juego (abstracto) desde el punto de vista de la SB, e indica la precisión de tu solución, así que si tu solución es realmente explotable (dentro del juego abstracto) por 0.001BB/mano, dilo.

2) El número de conjuntos de información en el juego (dar el total combinado para ambos jugadores).

3) El tamaño efectivo de la pila. El OP solo se menciona en 100BB, pero los datos para otros tamaños de pila efectivos también serían interesantes.

Creo que hay un problema con tu definición de ev_sb; ha incluido una definición recursiva que no tiene sentido para mí.

Además, su definición de r_ev posiblemente haya complicado la definición del problema. En vez de

r_ev es la parte del bote inicial de 1.5BB que gana sb cuando r

Redefino r_ev para que sea el EV del SB cuando el SB abre-limpea o abre-sube, que es -0.5 * % pierde + 1.0 * % gana. Al hacer cálculos de EV para SB, solo cuenta las contribuciones de SB cuando SB pierde (es decir, -0,5), pero solo cuenta las contribuciones de BB cuando SB gana (es decir, 1,0, no 1,5).

Se sabe lo siguiente sobre estas variables en el juego GTO:

  • 0 < ev_sb < 1
  • ev_sb = -ev_bb
  • ev_sb = -0.5 * f + r * r_ev

lo que implica que

  • 0.5 < r_ev < 1

pero r no está acotado (excepto que 0 < r < 1, por definición). Entonces, r_ev tiene un límite más estricto, mientras que r tiene un límite más flexible que el que ha afirmado.

Puede obtener límites más estrictos calculando el valor esperado de alguna estrategia específica (llámela S1), sabiendo que la estrategia GTO será >= S1. Por ejemplo, sea S1 la estrategia en la que la ciega pequeña va all-in con AA y se retira de todas las demás manos. Es un problema de probabilidad bastante simple para calcular los valores esperados en esa situación. Existe una amplia clase de estrategias "all-in preflop" que puede calcular de manera similar, y la solución GTO es al menos tan buena como la mejor de ellas.