¿Por qué las calificaciones de Elo para ir son más altas que para el ajedrez?

Si comparamos las calificaciones de Elo(-like) en ajedrez y en go, vemos que las calificaciones más altas publicadas para go (3621 para Ke Jie el 13 de marzo de 2016 en goratings.org ) son más altas que las de ajedrez (2851 para Magnus Carlsen a partir del 01-03-2016 en FIDE.com ).

¿Es la mejor explicación una de las siguientes sugerencias, o algo más?

  • En cierto sentido, el go se juega mejor que el ajedrez. Si bien muchos en Occidente piensan que el ajedrez es el principal juego intelectual, creo que el go se ha estudiado más intensamente, ha tenido más apoyo en la cultura oriental que el ajedrez donde se juega y es financieramente más gratificante.
  • Go es mejor para distinguir ligeras diferencias en la fuerza, por ejemplo, porque los juegos son más largos o porque los empates son raros (alrededor de 1 juego en 50, creo).
  • Hay alguna diferencia arbitraria en la forma en que se aplica el enfoque de Elo al go y al ajedrez, por ejemplo, una línea de base arbitraria o un factor de escala.

En cualquier caso, se necesita una explicación de cómo funciona el sistema de calificación y, en su caso, cómo interactúa con la naturaleza de los juegos para que la respuesta sea completa. Si es esclarecedor, también sería bienvenida una comparación con otros juegos; por ejemplo, ¿qué pasaría con las calificaciones de un juego trivial como tres en raya ?

Me doy cuenta de que los sistemas no están destinados a una comparación directa, pero espero que aún permitan sacar algún tipo de conclusión. Después de todo, se basan en los mismos principios, aunque varios parámetros pueden establecerse de manera diferente.

Vale la pena señalar que los dos sistemas usan diferentes valores de K, y Go parece golpear a los jugadores de mayor rango con menos dureza en caso de pérdida. No tengo tiempo para entrar en detalles sobre esto, pero vale la pena considerar que las matemáticas utilizadas para crear las clasificaciones en los niveles superiores en cada juego son diferentes.
@SocioMatt: Me temo que sentí lo mismo por descubrir lo suficiente sobre cómo funcionan los sistemas (sé menos que tú, sospecho), ¡pero esperaba que hubiera alguien aquí que supiera más!
No pienses demasiado en esto. En este momento, goratings.org es una iniciativa individual y no está respaldada por ninguna organización oficial de go. Es posible que desee dejar un mensaje al autor para obtener más explicaciones (información de contacto en la parte inferior de la página).
Además, tenga en cuenta que Remi Coulon es el autor de GoRating y también el autor del anterior top AI: ¡CrazyStones!
@Christophe: También estaba pensando en las calificaciones reportadas para Alpha Go, aparentemente basadas en Coulom, R. Calificación de toda la historia: un sistema de calificación bayesiano para jugadores de fuerza variable en el tiempo. En Conferencia internacional sobre computadoras y juegos, 113–124 (2008). , donde informaron una fuerza de hasta 3186 para la versión distribuida, "computada por BayesElo " en el momento del partido Fan Hui. Me temo que no he comprobado si eso es lo que usa Goratings.
Aquí está la entrada de sensei sobre PRO ELO en China: senseis.xmp.net/?ChineseProRatings
(corrección no 3186 sino 3168)
PJTraill Como dijo @Kii, Remi Coulomb es el autor de goratings.org (su información de contacto se encuentra en la parte inferior de la página), por lo que es un circuito cerrado.

Respuestas (6)

No hay calificación ELO en go. E incluso ninguna calificación internacional oficial en absoluto. Una pregunta común en los foros de go es "¿cómo se compara mi calificación en [cualquier país o servidor en línea] con [otro país o servidor en línea]".

La Federación Europea de Go mantiene un sistema de calificación internacional donde Ke Jie tiene una calificación de 2956.

goratings.org es una iniciativa individual de Remi Coulom . Se ha vuelto popular porque les dio a los periodistas una forma de asignar una clasificación mundial a Fan Hui, pero este no es un sistema de clasificación oficial.

La conclusión es su respuesta 3, hay alguna diferencia arbitraria en la forma en que se aplica el enfoque para jugar al ajedrez.

Hay tres factores determinantes de cuán alta será la calificación Elo más alta para un juego determinado:

  • Aspectos internos del sistema de calificación: En primer lugar, cómo se inicializan las calificaciones. Si comienzas con todos obteniendo una calificación de 2000, los números se mantendrán más altos que si todos obtuvieran 1800. Pero también el factor K (cuán fuertes fluctúan las calificaciones) y otros detalles que podrían conducir a la inflación o deflación. Así que esta es su diferencia arbitraria parte de la respuesta.

  • El nivel en el que se juega un juego, es decir, qué tan cerca están los mejores jugadores de la fuerza de juego máxima humana. Esto depende mucho de cuántos jugadores jueguen el juego, cómo se apoya financieramente y qué recursos hay para volverse realmente fuerte. Me parece muy probable que el ajedrez se juegue a un nivel más alto que el go, porque los jugadores de ajedrez han tenido el beneficio de ayudantes sobrehumanos durante al menos 15 años.

  • La profundidad del juego, es decir, cuán grande sería la diferencia entre un principiante y el mejor (posible) jugador humano. Here go está claramente por delante del ajedrez, pero dudo que esto tenga mucho que ver con la complejidad del árbol del juego. Más bien, este es un efecto del amplio rango de dibujo en el ajedrez. Si reduce el rango de dibujo en el ajedrez, por ejemplo, acortando el control de tiempo, obtiene calificaciones de Elo "similares a" en el ajedrez. En los servidores de ajedrez con controles de tiempo rápidos, las calificaciones superiores a 3600 no son inusuales.

No entiendo las clasificaciones de Go, pero creo que está comparando manzanas con naranjas, es decir, las clasificaciones de Go elo no deben compararse con las clasificaciones de Chess elo.

Esta cita es de la comparación del rango de go con la calificación de ajedrez.

No es realmente posible. Se podría utilizar el sistema GoR europeo para ofrecer una comparación aproximada, pero el problema es que no está anclado de la misma manera.

Por supuesto, no están destinados a ser comparados; mi pregunta es si podemos, no obstante, sacar conclusiones interesantes. Sin embargo, gracias por su enlace, que es interesante y va mucho más allá de su primera cita negativa; algunos de los comentarios son ingenuos pero muchos son informativos, y debería tomarme más tiempo para estudiarlos.

El sistema ELO, como fue diseñado originalmente, tiene una media de 1500 y una desviación estándar de 400 puntos.

El teorema del límite central define cuántas personas pueden existir según este modelo dependiendo de su distancia de la media. Por ejemplo, una calificación de 3100 está a 4 desviaciones estándar de la media (1500 + 4 x 400 = 3100). De acuerdo con el teorema del límite central, habría un 99,993666 % dentro de 4 desviaciones estándar, o aproximadamente 1 de cada 16 000 jugadores que estarían fuera de esto. Por supuesto, sabemos que no hay jugadores humanos con una calificación superior a 3100, por lo que podemos ver de inmediato que el sistema ELO no funciona correctamente. Si los jugadores siguieran una distribución normal, entonces esperaríamos que hubiera, de aproximadamente 1 millón de jugadores, alrededor de 80 con una calificación superior a 3100, pero este no es el caso.

Ahora, en cuanto a un jugador de igo que tiene una calificación superior a 3600, eso es 5,25 desviaciones estándar por encima de la media (1500 + 5,25 x 400). De acuerdo con el teorema del límite central, debería haber una persona entre 10 millones que tenga esta calificación. Si asumimos que hay 10 millones de jugadores go calificados y hay uno por encima de 3600, entonces eso encaja con el modelo.

Hay dos problemas al comparar las dos calificaciones de los campeones. Una es que la distribución de los jugadores, ciertamente en el ajedrez, y posiblemente en igo, no es una distribución gaussiana normal, por lo que el sistema ELO siempre será erróneo hasta cierto punto. En segundo lugar, muchos sistemas de calificación, especialmente el sistema FIDE del ajedrez, no usan ELO puro, sino que manipulan la calificación de varias maneras. Además, el sistema FIDE no tiene una media establecida y solo tiene un pequeño número de jugadores, no toda la población mundial de jugadores de ajedrez. Por lo tanto, es difícil extraer algún significado de la comparación.

Si tiene dos juegos, cada uno de los cuales clasifica a los jugadores mediante el sistema de clasificación ELO , entonces el juego con clasificaciones más altas generalmente se considera "más complejo" que el juego con clasificaciones más bajas. En el sentido de que hay niveles más discretos de aprendizaje a dominio. No me queda claro qué sistemas de clasificación se utilizan en su declaración, pero para que la conclusión se mantenga, los sistemas de clasificación utilizados deben ser idénticos.

Dicho todo esto, Go es definitivamente un juego más complejo que el Ajedrez, y es ampliamente reconocido como tal. Evidencia anecdótica para respaldar esa afirmación: los humanos han sido vencidos por las computadoras en el ajedrez por un tiempo, Go aparentemente solo está sucediendo hoy.

"Mejor" no es una buena palabra para usar en este contexto, ya que es un término bastante subjetivo. La "complejidad" se usa típicamente en este tipo de conversaciones.

Es interesante notar que la clasificación ELO más alta para League of Legends que pude encontrar es 3069 .

¡Ese hilo de LoL en realidad también menciona calificaciones de 3156 y 3160!
Siento que la complejidad no es exactamente lo mismo, siendo una medida del "tamaño" de un problema o, mejor, algoritmo; Estoy pensando en lo bien que los humanos han dominado el juego, pero supongo que podría relacionarlos muy bien observando la complejidad de los algoritmos que usa la gente (que, por supuesto, son inaccesibles) o de algoritmos de fuerza equivalente (como Alpha Go !). Sin embargo, la complejidad depende de la máquina abstracta utilizada por el algoritmo, y el conocimiento humano es comparable a expandir el alfabeto o la tabla de instrucciones.
@PJTraill Punto justo. Utilizo complejidad para describir tanto la complejidad combinatoria como la complejidad del "dominio humano" de los juegos. Pero, como lo usé anteriormente, es un poco ambiguo.
¿Alguna referencia para apoyar su primera oración? Según lo que he leído, Elo se trata más de la diferencia de puntos, mientras que los valores absolutos dependen de cómo esté anclado el sistema. El rango (principiante a superior) podría ser una mejor medida.
Estoy votando negativamente esta respuesta por la razón que @Christophe (y yo) mencionamos. Los valores que ingresa en una ecuación ELO pueden cambiar el resultado de manera bastante drástica. No tiene nada que ver con la complejidad del juego y todo que ver con las suposiciones que están integradas en el valor K.

Hay algunas buenas respuestas a la pregunta principal, y esto es solo para abordar la pregunta secundaria relacionada con juegos triviales como el tic-tac-toe (porque creo que es una pregunta increíble;)

  • Asumiendo un juego competitivo de adultos, donde cada competidor conoce la solución, entonces el resultado de cada juego sería un punto muerto, y todos los jugadores tendrían la misma clasificación.

Pero esto lleva a la pregunta muy interesante de cómo sería una distribución de ELO si hubiera un juego formal y competitivo entre los niños pequeños.

Lo menciono porque ha habido cierta discusión en este hilo sobre la relación entre la complejidad del juego (tamaño del problema) y la distribución del ranking.