¿AlphaGo Zero y AlphaGo Lee juegan razonablemente este doble ko?

En el octavo juego de la serie 1 entre AlphaGo Zero y AlphaGo Lee surge la siguiente posición con un doble ko en {A,C}×{13,14}: Posición al comienzo del juego de doble koEn el siguiente movimiento, AlphaGo Lee (Negras) juega el intercambio de doble ko A14 -C13 antes de su siguiente movimiento efectivo en T15 y tres movimientos efectivos subsiguientes; luego AlphaGo Zero se une a la diversión y también hace intercambios de doble ko antes de sus movimientos efectivos. Esto continúa hasta el movimiento 272; después de 276, las negras renuncian.

No veo el beneficio en estos intercambios en comparación con jugar inmediatamente en T15, etc. ¿Son útiles estos intercambios o simplemente algo que su respectivo entrenamiento nunca les enseñó a hacer? Si son útiles, ¿para qué sirven?

1 Véase el artículo de Nature en https://www.nature.com/articles/nature24270#t1 ; el texto completo no es gratuito, pero los registros de juegos seleccionados se pueden descargar en https://media.nature.com/original/nature-assets/nature/journal/v550/n7676/extref/nature24270-s2.zip

Respuestas (1)

Hay una diferencia entre las dos posiciones semiestables de doble ko, aunque bastante pequeña. C14 reduce el número inmediato de libertades de la pierna G13. Esto significa que las negras tendrán un tempo libre cuando G13 se quede sin libertades, si asumimos que las negras pueden encontrar una amenaza de ko lo suficientemente grande como para responder a la captura de C13 con C14 para forzar el gote de B15.

Suponiendo que las negras todavía tienen una amenaza de ko lo suficientemente grande cuando G13 se queda sin libertades, el valor de mantener ocupada la libertad en C14 es muy probablemente de 1 punto (convirtiendo un sentido de un punto para las blancas en un sentido inverso, como podemos inferir de lo que sucede más adelante en el juego), por lo que la secuencia de dos movimientos de capturar el doble ko en C13/C14 seguido de una respuesta como A13/A14 tiene un valor miai (relacionado con ko) de 1 para ambos jugadores. Eso explica por qué ambos jugadores aprovechan para capturar este doble ko siempre que pueden.

Otra forma de decirlo es atribuir un promedio de 4,5 libertades al grupo G13 (alternando entre 4 y 5), y las blancas pueden forzarlo cuando lo necesitan si las negras no pueden encontrar una amenaza de ko lo suficientemente grande.

Gracias, me ha aclarado un poco algunas cosas, aunque hay muchas cosas que todavía no entiendo, me temo, no solo por qué Black renuncia cuando lo hace, sino también por qué Black está en un lugar mejor después de 239 @ A14, 240@C13, 241@T15 de lo que sería con 239@T15; después de todo, le da (temporalmente) a las blancas una libertad extra en C14. Observo que las blancas, tomando la mitad del doble ko, amenazan con eliminar un punto en B12 y hacer puntos en A14, C14 y B15, mientras que las negras amenazan con hacer lo contrario. Por supuesto, si las negras conectan en A13 o C13, B15 no es un punto para las blancas de ninguna manera.
Ok, me doy cuenta de que no presté mucha atención a lo que sucede en el juego. Jugar 247 y cancelarlo con 251 sí parece inútil, aunque no hace daño. Pero B5, que viene justo después, desperdicia una amenaza de ko. Entonces, creo que las negras ya se dieron cuenta de que la situación no tenía remedio y solo estaban retrasando el final del juego porque todos los demás movimientos parecían estar más cerca de la derrota.