Uno de los temas recurrentes en los comentarios que he leído sobre los juegos de AlphaGo es que, de vez en cuando, la IA hacía una jugada sonora que, sin embargo, era completamente desconocida para su oponente (y para los espectadores). En consecuencia, el oponente no pudo apreciar completamente el movimiento y contrarrestarlo de manera efectiva. (o incluso fueron expulsados del juego por completo por algunos movimientos)
Esto me deja con dudas; ¿Qué tan importante es este efecto para el éxito de AlphaGo? O dicho de otra manera, cuando los humanos hayan aprendido de los nuevos tipos de juegos que han visto jugar AlphaGo, ¿AlphaGo seguirá disfrutando de su nivel actual de éxito?
Yo diría que la ventaja de AlphaGo no se puede atribuir significativamente a la novedad de sus movimientos.
Los juegos AlphaGo públicos originales fueron aquellos contra Lee Sedol, el segundo jugador clasificado en el mundo, en marzo de 2016. En ese momento, como se mencionó, varios de los movimientos de AlphaGo fueron novedosos y sorprendentes para Lee Sedol y los observadores.
Luego, después de que los jugadores tuvieran nueve meses para estudiar el estilo de juego de AlphaGo, en diciembre de 2016 jugó 59 juegos en línea no oficiales bajo los nombres "Magister" y "Master", incluso contra varios de los jugadores mejor clasificados. Ganó todos los juegos. No he visto muchos comentarios de esos juegos, pero entiendo que algunos de los jugadores usaron movimientos que se observaron por primera vez en los juegos AlphaGo originales. Entonces, en este punto, creo que eran menos novedosos, porque se estaban convirtiendo en parte de las estrategias de los jugadores humanos.
Finalmente, en mayo de 2017, AlphaGo jugó una variedad de juegos en Wuzhen Future of Go Summit, incluido un partido contra Ke Jie, el jugador mejor clasificado del mundo. El comentario de esos juegos no indicó que AlphaGo realizó una cantidad significativa de movimientos sorprendentes o difíciles de responder, sino que su considerable ventaja provino de su capacidad para determinar con precisión los valores de los movimientos, intercambios y territorio, y su capacidad para jugar en todo el tablero en lugar de concentrarse demasiado en el área actualmente activa.
AlphaGo ejecuta movimientos que son "novedosos", y esa es la clave, pero no la razón, de su éxito.
La razón por la que los movimientos se consideran "novedosos" es que han sido examinados y rechazados por jugadores humanos. Entonces, la pregunta es, ¿las películas de seguimiento (y las variaciones) de Alpha Go prueban que los movimientos son correctos o no? La respuesta casi invariable es que los movimientos de Alpha Go son sólidos y que los jugadores humanos se perdieron los seguimientos correctos, algunos de los cuales son contradictorios. Por ejemplo, se dio cuenta en retrospectiva de que AlphaGo rompería las secuencias un movimiento antes o un movimiento después de lo que lo haría un jugador humano, maximizando así el valor de las secuencias y superando las líneas alternativas utilizadas por los jugadores humanos. Dicho de otra manera, AlphaGo podría calcular más profundamente que los jugadores humanos.
El programa parece tener algunas fallas que ocasionalmente lo hacen ejecutar movimientos que son (ligeramente) defectuosos en retrospectiva. Los humanos han estudiado estos fallos intentando superarlos, hasta ahora sin éxito. La razón es que, si bien estos movimientos pueden fallar por un punto o dos, AlphaGo mejorará durante el transcurso de un juego con respecto al juego humano, digamos, cinco puntos, en una o más ocasiones.
usuario7583
cachonda
cachonda