¿Alguien conoce el algoritmo de AlphaGo? Escuché que está relacionado con las redes neuronales. ¿Pero no sabes los detalles? Entonces no encuentra la solución para ganar de forma determinista, ¿verdad? Creo que sí, porque Lee Sedol ganó un juego. ¿Es cierto que en el ajedrez DeepBlue resuelve la solución única para ganar, por lo que no hay forma de que los seres humanos puedan vencerla?
Aquí está el artículo del equipo de AlphaGo que tiene todos los detalles (detrás de un muro de pago): http://www.nature.com/nature/journal/v529/n7587/full/nature16961.html
Di un par de charlas técnicas sobre esto recientemente. Este es sobre cómo funciona AlphaGo y el partido con Fan Hui 2p: https://www.youtube.com/watch?v=HTDxpxmFRGo
Di otra charla el año pasado sobre por qué es difícil crear una buena Go AI. Este también explica brevemente las reglas: http://blog.fogcreek.com/go-and-artificial-intelligence-tech-talk/
AlphaGo se basa en gran medida en Monte-Carlo Tree Search (MCTS), que es una forma de toma de decisiones que utiliza elecciones aleatorias como un análogo de la creatividad. Específicamente, permite que el algoritmo "piense" más allá de los límites de sus procedimientos de evaluación racional. (Las elecciones aleatorias se analizan y ponderan posteriormente para determinar qué elecciones aleatorias son potencialmente útiles). La capacidad de utilizar con éxito este método para vencer a los jugadores humanos más fuertes es en parte una función de la supercomputación, ya que DeepMind tiene procesadores muy rápidos y prácticamente ilimitado. memoria.
Esto es bastante distinto de resolver un juego en el contexto de la Teoría Combinatoria de Juegos .
Específicamente: no podemos saber si AlphaGo jugó de manera óptima, solo que jugó de manera más óptima que Lee Sedol en 4 de 5 juegos.
El ajedrez también sigue sin resolverse, pero el juego ha sido tan intensamente estudiado y DeepBlue tan bien desarrollado, que ahora parece imposible que un ser humano prevalezca.
El estado no resuelto de estos juegos no triviales, que se denominan además partidista , secuencial , determinista (sin azar) y de información perfecta , es una función de la intratabilidad .
En el caso de Go, esto significa que si convirtió cada átomo del universo en un dispositivo informático y tuvo que calcular todo el intervalo de tiempo del universo, aún no podría expresar todo el árbol de juego de Go. El ajedrez es menos complejo, pero generalmente se lo considera irresoluble.
El artículo de DeepMind publicado en Nature: Mastering the game of Go with deep neural networks and tree search ahora está disponible gratuitamente.
Kii
mafu
DuqueZhou