Siguiendo un artículo que leí en el NY Times , aprendí que los mejores bots de limit hold'em son mejores que los mejores humanos. Tengo entendido que para cada estado del juego que alcanzan, estos bots deben calcular un conjunto de pesos, que suman uno, para el conjunto de acciones disponibles, un subconjunto de {pasar, igualar, apostar, subir, retirarse}. Mi pregunta es, ¿hay un programa de computadora decentemente fuerte disponible contra el que pueda jugar al póquer y poder consultar qué multiestrategia jugaría si estuviera en mi lugar? Me alienta el artículo del NY Times que dice que el bot sobre el que están escribiendo es un jugador de video póquer ganador incluso sin adaptarse a las tendencias de su oponente.
Hay buena información aquí, pero está dirigida a personas que buscan escribir sus propios bots, no aprender de ellos.
Soy Mike Johanson, uno de los autores del artículo reciente "HULHE está resuelto", y escribí una buena parte del código de Cepheus.
El enlace de kuzzooroo era el correcto. En el enlace que proporcionó (no reproducido aquí - nueva cuenta, no tengo reputación para publicar> 2 enlaces), puede consultar cualquier parte de la estrategia de Cepheus, o jugar contra ella, al menos, podrá una vez que la el tráfico se aclara, hemos tenido que deshabilitar la página de reproducción de Cepheus por ahora. Pero el servicio de consulta está funcionando bien.
Si desea leer el artículo de Science, puede encontrar un enlace en mi página web personal . Mis artículos anteriores allí también brindarán más detalles sobre el algoritmo en el que se basa, llamado CFR.
Si desea el código fuente, también está disponible: licencia BSD. Enlace
En cuanto a otros programas y grupos, y la historia de nuestro esfuerzo... El Computer Poker Research Group de la Universidad de Alberta comenzó en 1994, y hemos tenido un enfoque considerable en heads-up limit hold'em desde 2001. En 2003 creó la primera estrategia teórica de juego decente para el juego, llamada PsOpti (vlzvl mencionó a Sparbot - es la misma estrategia, renombrada como Poker Academy). En 2007 y 2008, nuestro programa Polaris compitió contra profesionales humanos, perdiendo por poco en 2007 y ganando por poco en 2008, marcando la primera vez que una computadora derrota a profesionales de póquer humanos en una partida significativa. En 2011, desarrollamos el primer algoritmo manejable para HULHE que nos permite calcular una contraestrategia óptima para derrotar una estrategia determinada y medir cuánto pierde esa estrategia frente a la contraestrategia. Eso nos permite medir qué tan cerca estamos de un juego imbatible. Desde entonces, nos hemos estado acercando cada vez más al juego perfecto (es decir, hacia una pérdida de 0 en el peor de los casos) y hemos estado publicando nuestro progreso a lo largo de los años en artículos de investigación abiertos y de acceso público.
En este documento, después de 13 años de enfoque en HULHE desde nuestra primera estrategia teórica de juego decente hasta esta, anunciamos que finalmente hemos resuelto esencialmente el juego. Cepheus es máximamente vencible por menos de 0.000986 ciegas grandes por juego, o por debajo de 0.05 apuestas grandes / 100 si prefieres esas unidades. Se necesitarían más de 60 millones de manos usando la contraestrategia perfecta para tener un 95 % de confianza de ganar contra Cepheus, razón por la cual decimos que está esencialmente resuelto: se necesitaría más que una vida humana de juego para discernir estadísticamente el diferencia entre Cepheus y una estrategia óptima exacta. Entramos en mucho más detalle sobre esto en el documento.
En cuanto a la afirmación de Jim Beam de que estamos reclamando el crédito por algo que otros ya han hecho... No estoy de acuerdo. Hemos estado en este espacio durante 20 años, fuimos los primeros en lograr los grandes hitos anteriores en HULHE (primera estrategia no terrible, primer programa para vencer a los humanos, primera medición de la pérdida en el peor de los casos) y hemos impulsado la ciencia por publicando completamente nuestro trabajo en cada paso del camino. Esencialmente, resolver el juego es el paso final de una larga línea de investigación sobre este juego.
No se sabe mucho sobre PokerSnowie y el juego de casino: no publican estadísticas sobre qué tan cerca están del óptimo, ni detalles útiles sobre qué algoritmos usan o cómo funcionan sus programas. PokerSnowie afirma estar cerca del equilibrio, pero no ofrece prueba alguna, y de las discusiones sobre 2+2 donde también afirman jugar de forma óptima con 6 jugadores y sin límite, está claro que no saben qué "juego "óptimo teórico" significa, o están exagerando: sin límite es inconmensurablemente más grande que el límite mano a mano y no tiene sentido reclamar un juego óptimo allí, y una estrategia "óptima" no tendría ninguna propiedad teóricamente útil en un 6- juego de jugador En realidad, en los hilos 2+2, lo admitieron y eliminaron la mayor parte de la publicidad de su página web que menciona "juego óptimo".
Cepheus es una estrategia esencialmente óptima para el heads-up limit hold'em, y puede jugar contra cualquiera de ellos, o cualquier programa humano o de otro tipo, y se garantiza que no perderá. Somos @PolarisPoker en Twitter; lo usamos principalmente para publicar enlaces a los nuevos artículos que publicamos.
¡El heads-up limit hold'em ya está resuelto! . La IA tiene un excelente sitio web que, entre otras cosas, le indicará la multiestrategia óptima en http://poker.srv.ualberta.ca/ .
Poker Academy Pro
ciertamente tiene un bot muy poderoso especializado en heads-up, llamado Sparbot . Lo bueno de esto es que no intenta aprender al oponente, por lo que es más fácil emularlo. Aunque no lo probé.El artículo del NY Times me fascinó porque ignoraba por completo el hecho de que Poker Snowie ya existe. Googlealos y lee sobre ellos. Han existido por un tiempo y generalmente se acepta que juegan muy, muy bien al póquer. No estoy seguro de si han "resuelto" el póquer (¡lo que sea que eso signifique!), pero han existido por mucho tiempo.
De hecho, la mayoría de la gente ni siquiera se da cuenta de que ya hay máquinas LHE en los casinos contra las que puedes jugar y que también juegan muy, muy bien al póquer (basado en el trabajo de Poker Snowie). Puedes jugarlos cara a cara, varias apuestas. Nuevamente, tal vez no lograron "resolver" el póquer, pero ¿crees que ofrecieron en los casinos porque están perdiendo dinero en ellos? Por supuesto no. Entonces, todo lo que tiene que hacer es encontrar un casino en su área que ofrezca esto y puede probarse contra una IA de póquer muy buena.
No hay IA disponibles públicamente para practicar y entrenar al nivel que me temo. Si está buscando una IA contra la que jugar, puede consultar Poker Academy, su sitio ha tenido altibajos en los últimos años, pero se considera la mejor IA de límite disponible públicamente. Sin embargo, sus IA sin límite son basura.
Actualizar. Como señaló kuzzooroo, la respuesta anterior ahora es incorrecta. Por favor, vea la respuesta de kuzzooroo aquí .
Codificador desconocido