Béisbol y DWar

Pregunta de dos partes realmente.

¿Cuál es la fórmula para calcular DWar?

Además, según tengo entendido; parece depender de algunas estadísticas que históricamente fueron monitoreadas de manera mucho menos estricta que, por ejemplo, jonrones o hits. Si ese es el caso, ¿la precisión de la estadística cae exponencialmente después de un número determinado de años? ¿Hay una línea de corte conocida en la que los números dejan de ser confiables? ¿O mi afirmación es incorrecta?

DWar, como en WAR defensivo?
No estoy seguro de que esto sea respondible de una manera... concisa. ¿Puede especificar el dWAR de qué fuente está preguntando? (WAR y sus variantes no son una sola estadística: Fangraphs, Basball-Reference.com, etc. cada uno usa fórmulas diferentes).
No sabía que había tantas opciones. Gracias por eso.

Respuestas (2)

La fórmula básica para WAR es la siguiente:

WAR = (Batting Runs + Base Running Runs + Fielding Runs + Positional Adjustment + League Adjustment +Replacement Runs) / (Runs Per Win)

Diferentes fuentes tendrán diferentes formas de calcular estos valores.

Baseball Reference (fuente de ESPN) utiliza:

bWAR:
    RS (Runs Scored) = Runs per Win + (mwRAA (a modified weighted runs above average) + Base Running Runs + Park Factor + Position Adjustment + Replacement Level) 
    RA (Runs Allowed) = Runs per Win - DRS (Defensive Runs Saved) 
    Win - Loss% (W-L%)= (RS^x)/(RS^x + RA^x)
        where RS = (league Runs/Game /2) + Player Offensive Runs
        RA = (league Runs/Game /2) - Player Defensive Runs Saved
        x = (Runs Per Game involving Player)^.285
    Runs Per Game involving Player = 53.6 * (League Runs Per Out + (Player Runs Batting + Player Runs Double Plays + Player Runs Base Running + Player Positional Adjustment - Player Fielding Runs)/(6 * Player Innings). 
    Wins Above Average (WAA) = (W-L% - .500) * Player Games Played
    Wins Run Scoring Environment (WRSE) = Player Total Runs / ((2 * (league Runs/Game)^.715) - (2 * (Runs per Game involving Player)^.715))
    Wins Above Replacement bWAR = WAA + Wins Run Scoring Environment 

Usos de fangraphs:

fWAR = (wRAA + UZR (Ultimate Zone Rating) + wSB (weighted Stolen Base runs) + UBR (Ultimate Base Running) + Positional Adjustment + League Adjustment + Replacement Level)/ Runs Per Win

Las carreras por victoria se pueden encontrar aquí

Para responder a tu primera pregunta. Extrapolando DWAR de fWAR es:

fDWAR = UZR / Runs Per Win 

Para un análisis en profundidad de cómo calcular UZR ver aquí

Como probablemente pueda ver, extrapolar DWAR de bWAR es un poco más difícil.

W-L% = ((League Runs/Game / 2)^(Runs/Game involving Player))/((League Runs/Game / 2)^(Runs/Game involving Player) + ((League Runs/Game / 2)- Player Defensive Runs)^(Runs/Game involving Player))
DWAA = (W-L% - .5) * Games Played
DWRSE = Player Defensive Runs / ((2 * (league Runs/Game)^.715) - (2 * (Runs per Game involving Player)^.715))
DWAR = DWAA + DWRSE

Para un análisis en profundidad de cómo calcular DRS ver aquí

Para responder a tu segunda pregunta . Las estadísticas utilizadas para las victorias defensivas modernas son alrededor de 2002 (la referencia de béisbol las usa a partir de 2003) antes de que este año se use TZR en lugar de UZR o DRS. TZR es un sistema ideado por Sean Smith con una breve descripción aquí, que asigna hits de los bateadores para posicionar a los jugadores según el tipo de bola bateada y la ubicación. Estos se han reconstruido hasta cierto punto a partir de fuentes históricas jugada por jugada, pero los datos se derivan significativamente más si solo se dispone del tipo de bola bateada y la ubicación de los outs. Entonces, si desea mantener todo igual, es menos justo comparar DWAR para jugadores antes de 2003 con las estadísticas actuales, cuanto más retroceda, más se acercará a un punto en el que todas las estadísticas se basan en datos de jugada por jugada. de calidad variable. Para ser justos, los puntajes de caja eran de mucha mayor calidad a principios del siglo XX, en comparación con los de los años 40 en adelante, debido a un mayor consumo de béisbol por radio y revisiones escritas más profundas.

No diría que hay un punto en el que hay un decaimiento exponencial, especialmente porque las personas brillantes que trabajaron en estos análisis han pasado por pasos minuciosos para retroceder en la historia y tratar de corregir sus métodos cuando los errores evidentes se vuelven evidentes.

En una nota al margen, se puede encontrar que los datos atrapados robando son variables según la fuente de los datos, especialmente para los corredores de base. Ver esta publicación.

¿Cuál es la fórmula para calcular DWar?

Para citar de Wikipedia :

No existe una fórmula claramente establecida para la GUERRA.


¿La precisión de la estadística desciende exponencialmente después de un número determinado de años atrás?

No veo ninguna razón por la que la precisión disminuya exponencialmente. Esa es una frase con un significado matemático muy específico, y no veo aquí un mecanismo que produzca un cambio exponencial en la precisión.


¿Hay una línea de corte conocida donde los números dejan de ser confiables?

Incluso si existiera, eso dependería exactamente de la fórmula (D)WAR que esté utilizando.

Este es un comentario, no una respuesta.
La pregunta es "¿cuál es la fórmula para calcular DWAR?". La respuesta es "No existe tal fórmula". Hecho.
Hay muchas fórmulas de este tipo. La pregunta no está clara como se indica, pero nada de lo anterior responde de manera útil a la pregunta.