¿Cuánto del éxito de AlphaGo se debe a la novedad?

Uno de los temas recurrentes en los comentarios que he leído sobre los juegos de AlphaGo es que, de vez en cuando, la IA hacía una jugada sonora que, sin embargo, era completamente desconocida para su oponente (y para los espectadores). En consecuencia, el oponente no pudo apreciar completamente el movimiento y contrarrestarlo de manera efectiva. (o incluso fueron expulsados ​​​​del juego por completo por algunos movimientos)

Esto me deja con dudas; ¿Qué tan importante es este efecto para el éxito de AlphaGo? O dicho de otra manera, cuando los humanos hayan aprendido de los nuevos tipos de juegos que han visto jugar AlphaGo, ¿AlphaGo seguirá disfrutando de su nivel actual de éxito?

Aparte: la capacidad de encontrar tácticas nuevas y sólidas sigue siendo un gran éxito para el equipo de AlphaGo, incluso si resulta que sus victorias se deben más a la novedad que a la habilidad, y no pretendo disminuir esa hazaña.
Una de las cosas que Ke Jie y Deep Mind mencionaron después de la segunda partida en la cumbre del futuro de Go fue que fue la partida más reñida que alguien jugó contra AlphaGo hasta el momento, en los primeros 100 movimientos. Durante los primeros 50 movimientos jugó perfectamente según AlphaGo. Luego, Ke Jie menciona más tarde que se entusiasmó con lo bien que estaba jugando y que podría haberlo llevado a cometer algunos errores o movimientos menos que ideales...
... Para resumir, hubiera sido interesante ver qué tan bien Ke Jie podría haber jugado si no se hubiera emocionado demasiado en el segundo partido, al menos según AlphaGo :)

Respuestas (2)

Yo diría que la ventaja de AlphaGo no se puede atribuir significativamente a la novedad de sus movimientos.

Los juegos AlphaGo públicos originales fueron aquellos contra Lee Sedol, el segundo jugador clasificado en el mundo, en marzo de 2016. En ese momento, como se mencionó, varios de los movimientos de AlphaGo fueron novedosos y sorprendentes para Lee Sedol y los observadores.

Luego, después de que los jugadores tuvieran nueve meses para estudiar el estilo de juego de AlphaGo, en diciembre de 2016 jugó 59 juegos en línea no oficiales bajo los nombres "Magister" y "Master", incluso contra varios de los jugadores mejor clasificados. Ganó todos los juegos. No he visto muchos comentarios de esos juegos, pero entiendo que algunos de los jugadores usaron movimientos que se observaron por primera vez en los juegos AlphaGo originales. Entonces, en este punto, creo que eran menos novedosos, porque se estaban convirtiendo en parte de las estrategias de los jugadores humanos.

Finalmente, en mayo de 2017, AlphaGo jugó una variedad de juegos en Wuzhen Future of Go Summit, incluido un partido contra Ke Jie, el jugador mejor clasificado del mundo. El comentario de esos juegos no indicó que AlphaGo realizó una cantidad significativa de movimientos sorprendentes o difíciles de responder, sino que su considerable ventaja provino de su capacidad para determinar con precisión los valores de los movimientos, intercambios y territorio, y su capacidad para jugar en todo el tablero en lugar de concentrarse demasiado en el área actualmente activa.

En aras de mejorar esta respuesta para futuros usuarios, Michael Redmond y Chris Garlock hacen muchas reseñas de la serie Master aquí en YouTube de AGA . Además, esos juegos fueron muy rápidos, por lo que la IA tiene un poco de ventaja allí :) Sin embargo, estoy de acuerdo en que el futuro de Go Summit mostró la fuerza de AlphaGo, y Michael y Chris comenzaron otra serie revisando algunos de los partidos AlphaGo vs AlphaGo publicados. después de la cumbre.
En realidad, no creo que quise decir mejorar, ya que esta respuesta podría ser mejor , sino que aquí hay un enlace si los futuros usuarios (u op) están interesados ​​​​en comentarios sobre la serie maestra . Es una buena respuesta como es :)

AlphaGo ejecuta movimientos que son "novedosos", y esa es la clave, pero no la razón, de su éxito.

La razón por la que los movimientos se consideran "novedosos" es que han sido examinados y rechazados por jugadores humanos. Entonces, la pregunta es, ¿las películas de seguimiento (y las variaciones) de Alpha Go prueban que los movimientos son correctos o no? La respuesta casi invariable es que los movimientos de Alpha Go son sólidos y que los jugadores humanos se perdieron los seguimientos correctos, algunos de los cuales son contradictorios. Por ejemplo, se dio cuenta en retrospectiva de que AlphaGo rompería las secuencias un movimiento antes o un movimiento después de lo que lo haría un jugador humano, maximizando así el valor de las secuencias y superando las líneas alternativas utilizadas por los jugadores humanos. Dicho de otra manera, AlphaGo podría calcular más profundamente que los jugadores humanos.

El programa parece tener algunas fallas que ocasionalmente lo hacen ejecutar movimientos que son (ligeramente) defectuosos en retrospectiva. Los humanos han estudiado estos fallos intentando superarlos, hasta ahora sin éxito. La razón es que, si bien estos movimientos pueden fallar por un punto o dos, AlphaGo mejorará durante el transcurso de un juego con respecto al juego humano, digamos, cinco puntos, en una o más ocasiones.