¿Cómo calcula AlphaGo?

Question

¿Cómo calcula AlphaGo?

Vamos
Hobby
computadora-ai

velut luna

¿Alguien conoce el algoritmo de AlphaGo? Escuché que está relacionado con las redes neuronales. ¿Pero no sabes los detalles? Entonces no encuentra la solución para ganar de forma determinista, ¿verdad? Creo que sí, porque Lee Sedol ganó un juego. ¿Es cierto que en el ajedrez DeepBlue resuelve la solución única para ganar, por lo que no hay forma de que los seres humanos puedan vencerla?

Kii

Consulte este artículo de Nature: nature.com/news/…

mafu

No, ninguno de ellos resuelve soluciones completas (si lo hicieran, ¡eso significaría que los juegos estaban resueltos!). --- Por cierto, las computadoras son "eso", no "ella" (a pesar de que la forma femenina se ha propagado por error recientemente).

DuqueZhou

@mafu ¡Mis autómatas tienen géneros! (Por supuesto, estoy firmemente a favor de la antropomorfización agresiva de la inteligencia algorítmica;) En una nota más seria, creo que se puede hacer una distinción entre autómatas que producen otros autómatas (ya sea por recombinación de funciones o partenogénesis), y dichos autómatas pueden denominarse "femeninos" para distinguirlos de los autómatas que no se reproducen.

Respuestas (2)

¿Cómo calcula AlphaGo?

No, ninguno de ellos resuelve soluciones completas (si lo hicieran, ¡eso significaría que los juegos estaban resueltos!). --- Por cierto, las computadoras son "eso", no "ella" (a pesar de que la forma femenina se ha propagado por error recientemente).
@mafu ¡Mis autómatas tienen géneros! (Por supuesto, estoy firmemente a favor de la antropomorfización agresiva de la inteligencia algorítmica;) En una nota más seria, creo que se puede hacer una distinción entre autómatas que producen otros autómatas (ya sea por recombinación de funciones o partenogénesis), y dichos autómatas pueden denominarse "femeninos" para distinguirlos de los autómatas que no se reproducen.

TimK · Answer 1

Aquí está el artículo del equipo de AlphaGo que tiene todos los detalles (detrás de un muro de pago): http://www.nature.com/nature/journal/v529/n7587/full/nature16961.html

Di un par de charlas técnicas sobre esto recientemente. Este es sobre cómo funciona AlphaGo y el partido con Fan Hui 2p: https://www.youtube.com/watch?v=HTDxpxmFRGo

Di otra charla el año pasado sobre por qué es difícil crear una buena Go AI. Este también explica brevemente las reglas: http://blog.fogcreek.com/go-and-artificial-intelligence-tech-talk/

¡Gracias! Y gracias de nuevo, para que tenga más de 15 caracteres de longitud.
Fue muy extraño leer el último artículo, que tiene solo un año: "Parece que probablemente veremos una computadora que pueda competir con los mejores profesionales en los próximos 10 o 15 años".
El sitio web de Deepmind tenía el papel sin un muro de pago, pero parece que se eliminó (o me lo perdí), ¡qué lástima!
@SztupY: realmente, lo que hizo Deepmind fue agregar mucho hardware gracias a que Google lo compró. No es tanto. Todos los algoritmos ya existían.
El documento ahora está disponible gratuitamente: willamette.edu/~levenick/cs448/goNature.pdf (¡Lo del muro de pago fue frustrante!)

DuqueZhou · Answer 2

AlphaGo se basa en gran medida en Monte-Carlo Tree Search (MCTS), que es una forma de toma de decisiones que utiliza elecciones aleatorias como un análogo de la creatividad. Específicamente, permite que el algoritmo "piense" más allá de los límites de sus procedimientos de evaluación racional. (Las elecciones aleatorias se analizan y ponderan posteriormente para determinar qué elecciones aleatorias son potencialmente útiles). La capacidad de utilizar con éxito este método para vencer a los jugadores humanos más fuertes es en parte una función de la supercomputación, ya que DeepMind tiene procesadores muy rápidos y prácticamente ilimitado. memoria.

Esto es bastante distinto de resolver un juego en el contexto de la Teoría Combinatoria de Juegos .

Específicamente: no podemos saber si AlphaGo jugó de manera óptima, solo que jugó de manera más óptima que Lee Sedol en 4 de 5 juegos.

El ajedrez también sigue sin resolverse, pero el juego ha sido tan intensamente estudiado y DeepBlue tan bien desarrollado, que ahora parece imposible que un ser humano prevalezca.

El estado no resuelto de estos juegos no triviales, que se denominan además partidista , secuencial , determinista (sin azar) y de información perfecta , es una función de la intratabilidad .

En el caso de Go, esto significa que si convirtió cada átomo del universo en un dispositivo informático y tuvo que calcular todo el intervalo de tiempo del universo, aún no podría expresar todo el árbol de juego de Go. El ajedrez es menos complejo, pero generalmente se lo considera irresoluble.

El artículo de DeepMind publicado en Nature: Mastering the game of Go with deep neural networks and tree search ahora está disponible gratuitamente.

Dado que Alpha Zero era más fuerte que Alpha Master, que era más fuerte que Alpha Go (Lee), ahora podemos estar seguros de que este Alpha Go no jugó de manera óptima contra Lee Sedol.

¿Cómo calcula AlphaGo?

velut luna

Kii

mafu

DuqueZhou

Respuestas (2)

TimK

velut luna

SztupY

mafu

Kii

DuqueZhou

DuqueZhou

PJTrail

¿AlphaGo Zero y AlphaGo Lee juegan razonablemente este doble ko?

¿Cuánto del éxito de AlphaGo se debe a la novedad?

¿Jugar en un tablero de 9x9 es un problema resuelto?

¿Existe un equivalente de Deep Blue en el mundo Go?

Exageración en fuseki ortodoxo: ¿Leela AI falla miserablemente?

¿Algoritmos de Computer Go aplicados a otros juegos?

Ranking de Go Software

¿Por cuántos puntos ganó Alphago contra Lee Se-dol?

¿Cuál es el ranking mundial real de Fan Hui?

¿Cómo/dónde puedo obtener comentarios de jugadores fuertes sobre mi juego?