Programa de poker que te cuenta la multiestrategia más conocida en limit hold'em

Siguiendo un artículo que leí en el NY Times , aprendí que los mejores bots de limit hold'em son mejores que los mejores humanos. Tengo entendido que para cada estado del juego que alcanzan, estos bots deben calcular un conjunto de pesos, que suman uno, para el conjunto de acciones disponibles, un subconjunto de {pasar, igualar, apostar, subir, retirarse}. Mi pregunta es, ¿hay un programa de computadora decentemente fuerte disponible contra el que pueda jugar al póquer y poder consultar qué multiestrategia jugaría si estuviera en mi lugar? Me alienta el artículo del NY Times que dice que el bot sobre el que están escribiendo es un jugador de video póquer ganador incluso sin adaptarse a las tendencias de su oponente.

Hay buena información aquí, pero está dirigida a personas que buscan escribir sus propios bots, no aprender de ellos.

Vea mi respuesta a continuación: el esfuerzo de Alberta está a años luz del hecho de que hay máquinas en los casinos a las que puede jugar hoy con una IA que la mayoría de los humanos no pueden vencer .

Respuestas (4)

Soy Mike Johanson, uno de los autores del artículo reciente "HULHE está resuelto", y escribí una buena parte del código de Cepheus.

El enlace de kuzzooroo era el correcto. En el enlace que proporcionó (no reproducido aquí - nueva cuenta, no tengo reputación para publicar> 2 enlaces), puede consultar cualquier parte de la estrategia de Cepheus, o jugar contra ella, al menos, podrá una vez que la el tráfico se aclara, hemos tenido que deshabilitar la página de reproducción de Cepheus por ahora. Pero el servicio de consulta está funcionando bien.

Si desea leer el artículo de Science, puede encontrar un enlace en mi página web personal . Mis artículos anteriores allí también brindarán más detalles sobre el algoritmo en el que se basa, llamado CFR.

Si desea el código fuente, también está disponible: licencia BSD. Enlace

En cuanto a otros programas y grupos, y la historia de nuestro esfuerzo... El Computer Poker Research Group de la Universidad de Alberta comenzó en 1994, y hemos tenido un enfoque considerable en heads-up limit hold'em desde 2001. En 2003 creó la primera estrategia teórica de juego decente para el juego, llamada PsOpti (vlzvl mencionó a Sparbot - es la misma estrategia, renombrada como Poker Academy). En 2007 y 2008, nuestro programa Polaris compitió contra profesionales humanos, perdiendo por poco en 2007 y ganando por poco en 2008, marcando la primera vez que una computadora derrota a profesionales de póquer humanos en una partida significativa. En 2011, desarrollamos el primer algoritmo manejable para HULHE que nos permite calcular una contraestrategia óptima para derrotar una estrategia determinada y medir cuánto pierde esa estrategia frente a la contraestrategia. Eso nos permite medir qué tan cerca estamos de un juego imbatible. Desde entonces, nos hemos estado acercando cada vez más al juego perfecto (es decir, hacia una pérdida de 0 en el peor de los casos) y hemos estado publicando nuestro progreso a lo largo de los años en artículos de investigación abiertos y de acceso público.

En este documento, después de 13 años de enfoque en HULHE desde nuestra primera estrategia teórica de juego decente hasta esta, anunciamos que finalmente hemos resuelto esencialmente el juego. Cepheus es máximamente vencible por menos de 0.000986 ciegas grandes por juego, o por debajo de 0.05 apuestas grandes / 100 si prefieres esas unidades. Se necesitarían más de 60 millones de manos usando la contraestrategia perfecta para tener un 95 % de confianza de ganar contra Cepheus, razón por la cual decimos que está esencialmente resuelto: se necesitaría más que una vida humana de juego para discernir estadísticamente el diferencia entre Cepheus y una estrategia óptima exacta. Entramos en mucho más detalle sobre esto en el documento.

En cuanto a la afirmación de Jim Beam de que estamos reclamando el crédito por algo que otros ya han hecho... No estoy de acuerdo. Hemos estado en este espacio durante 20 años, fuimos los primeros en lograr los grandes hitos anteriores en HULHE (primera estrategia no terrible, primer programa para vencer a los humanos, primera medición de la pérdida en el peor de los casos) y hemos impulsado la ciencia por publicando completamente nuestro trabajo en cada paso del camino. Esencialmente, resolver el juego es el paso final de una larga línea de investigación sobre este juego.

No se sabe mucho sobre PokerSnowie y el juego de casino: no publican estadísticas sobre qué tan cerca están del óptimo, ni detalles útiles sobre qué algoritmos usan o cómo funcionan sus programas. PokerSnowie afirma estar cerca del equilibrio, pero no ofrece prueba alguna, y de las discusiones sobre 2+2 donde también afirman jugar de forma óptima con 6 jugadores y sin límite, está claro que no saben qué "juego "óptimo teórico" significa, o están exagerando: sin límite es inconmensurablemente más grande que el límite mano a mano y no tiene sentido reclamar un juego óptimo allí, y una estrategia "óptima" no tendría ninguna propiedad teóricamente útil en un 6- juego de jugador En realidad, en los hilos 2+2, lo admitieron y eliminaron la mayor parte de la publicidad de su página web que menciona "juego óptimo".

Cepheus es una estrategia esencialmente óptima para el heads-up limit hold'em, y puede jugar contra cualquiera de ellos, o cualquier programa humano o de otro tipo, y se garantiza que no perderá. Somos @PolarisPoker en Twitter; lo usamos principalmente para publicar enlaces a los nuevos artículos que publicamos.

¡El heads-up limit hold'em ya está resuelto! . La IA tiene un excelente sitio web que, entre otras cosas, le indicará la multiestrategia óptima en http://poker.srv.ualberta.ca/ .

Buena esa. He actualizado mi respuesta para señalar a la gente la tuya.
No sé sobre eso . Un algoritmo 'esencialmente imbatible' (quizás lo sea) pero Poker Academy Prociertamente tiene un bot muy poderoso especializado en heads-up, llamado Sparbot . Lo bueno de esto es que no intenta aprender al oponente, por lo que es más fácil emularlo. Aunque no lo probé.

El artículo del NY Times me fascinó porque ignoraba por completo el hecho de que Poker Snowie ya existe. Googlealos y lee sobre ellos. Han existido por un tiempo y generalmente se acepta que juegan muy, muy bien al póquer. No estoy seguro de si han "resuelto" el póquer (¡lo que sea que eso signifique!), pero han existido por mucho tiempo.

De hecho, la mayoría de la gente ni siquiera se da cuenta de que ya hay máquinas LHE en los casinos contra las que puedes jugar y que también juegan muy, muy bien al póquer (basado en el trabajo de Poker Snowie). Puedes jugarlos cara a cara, varias apuestas. Nuevamente, tal vez no lograron "resolver" el póquer, pero ¿crees que ofrecieron en los casinos porque están perdiendo dinero en ellos? Por supuesto no. Entonces, todo lo que tiene que hacer es encontrar un casino en su área que ofrezca esto y puede probarse contra una IA de póquer muy buena.

¿Trabajas para Poker Snowie?
@WillCalderwood No, no, por supuesto que no. De hecho, no necesariamente me gustan todas las herramientas de Snowie, solo me gusta el reproductor. Simplemente no creo que sea justo ver a Alberta reclamar crédito por LHE cuando ya hay máquinas en los casinos. Eso es como si yo saliera y dijera: "¡Hola, chicos, inventé algo que llamo 'automóvil'! ¡¿Pueden creerlo?!?!".
Punto 1. Supongo que las máquinas de casino tienen rake, por lo que no necesitan una estrategia perfecta o casi perfecta para ganar. Solo necesitan jugar a un nivel aceptable. Punto 2, no puedes consultarlos.
@WillCalderwood hacer menos no más suposiciones aquí te ayudaría: / ¿Has investigado algo de lo que he publicado? No, las máquinas no tienen rake y puedes consultarlas . Poker Snowie es básicamente la única herramienta que te permite ingresar manos en el reproductor y te permitirá consultar EV y movimientos de acción en el camino. Cuando juegas contra él, también puedes obtener comentarios en tiempo real sobre los movimientos correctos o incorrectos, también con EV.

No hay IA disponibles públicamente para practicar y entrenar al nivel que me temo. Si está buscando una IA contra la que jugar, puede consultar Poker Academy, su sitio ha tenido altibajos en los últimos años, pero se considera la mejor IA de límite disponible públicamente. Sin embargo, sus IA sin límite son basura.

Actualizar. Como señaló kuzzooroo, la respuesta anterior ahora es incorrecta. Por favor, vea la respuesta de kuzzooroo aquí .

Desafortunadamente, parece que la página web de Poker Academy está actualmente inactiva. Sin embargo, se vincula con Poker Genius , que afirma proporcionar "frecuencias de acción".
Poker Academy está "abajo" en el sentido de que la empresa está fuera del negocio. Poker Genius dice ser el reemplazo de facto, pero no lo he probado.
Esto es simplemente incorrecto, PUEDES jugar. por favor mira mi respuesta
@JimBeam En el momento en que se publicó esta respuesta, era correcta. La respuesta que publicó el kuzzooroo hace unas horas es más correcta que tu respuesta.
@WillCalderwood De ninguna manera eso es correcto. Las máquinas han estado en los casinos durante más de 18 meses; su respuesta fue hace menos de un año.
@JimBeam ¿Leíste la pregunta? "Mi pregunta es, ¿hay un programa de computadora decentemente fuerte disponible contra el que pueda jugar al póquer y poder consultar qué multiestrategia jugaría si estuviera en mi lugar?". ¿Puede explicar cómo puede consultar las máquinas de casino para su estrategia?
@WillCalderwood, las máquinas se basan en Poker Snowie, que puede consultar en tiempo real mediante el juego o el reproductor. Esto no es algo difícil, solo estás siendo demasiado perezoso para salir y obtener esta información :/