¿Es cierto que "solo diez días hábiles representan el 63 por ciento de los rendimientos de los últimos 50 años"?

Caí en un agujero de conejo de Wikipedia y aterricé en la página titulada Siete estados de aleatoriedad . No puedo explicar en una sola oración de qué está hablando, pero mi pregunta es sobre una cita extraña al final de la sección de Historia (con mi énfasis)

Mandelbrot y Taleb señalaron que, aunque se puede suponer que las probabilidades de encontrar a una persona que mida varias millas de altura son extremadamente bajas, no se pueden excluir observaciones excesivas similares en otras áreas de aplicación. Argumentaron que si bien las curvas de campana tradicionales pueden proporcionar una representación satisfactoria de la altura y el peso en la población, no proporcionan un mecanismo de modelado adecuado para los riesgos o rendimientos del mercado, donde solo diez días de negociación representan el 63 por ciento de los rendimientos de los últimos 50. años.

¿Es esto cierto? ¿O es incluso justo preguntar si esto es cierto? ¿Alguien sabe de dónde se originó esta cita o es solo un "hecho" inventado por quien escribió esta página de Wikipedia? Si es cierto, ¿hay una mejor explicación menos técnica en alguna parte?

Lea la intención y el propósito de los comentarios . Si tiene una solicitud para que el OP aclare la pregunta u ordene más detalles, ese es el propósito. Se han publicado 5 respuestas largas ahora, y abordan esto bastante bien.
He visto muchas afirmaciones de esta naturaleza. Sospecho que la mayoría de ellos han hecho la aritmética correctamente. Para lo que se usa aquí es para afirmar que la distribución normal es un mal modelo de la realidad lejos de la media, porque los eventos que superan muchas desviaciones estándar son mucho más comunes de lo que afirmaría la distribución normal. La distribución normal es muy conveniente porque tenemos muchos teoremas sobre lo que sucede cuando las cosas se distribuyen normalmente. Mientras te mantengas cerca de la media, no importa mucho cuál
curva en forma de campana que utilice. Cuando vas lejos importa mucho. En la vida real, las colas son siempre mayores de lo que diría una distribución normal.
@RossMillikan: sus comentarios se pueden copiar y editar en una respuesta. Resume maravillosamente gran parte de la intención de Taleb en su breve discusión sobre este fenómeno. Tratando de ser positivo y no un policía de comentarios.....

Respuestas (9)

Aleatoriedad leve frente a salvaje: centrarse en los riesgos que importan y centrarse en las excepciones que prueban la regla son copias del artículo original al que se hace referencia en la página de Wikipedia. Los autores son académicos muy respetados, así que asumo que tienen algún apoyo para la declaración, pero el artículo no parece explicar exactamente lo que asumieron.

Para una verificación de plausibilidad, de acuerdo con este gráfico , el aumento compuesto total en el índice S&P 500 desde 1970-01-01 hasta el 2018-12-31 (48 años tan cerca de los 50 años que citan aunque obviamente un período de 50 años diferente) es 2622.25% (estoy usando el Cambio en el índice en lugar de incluir dividendos porque eso requiere una investigación real). También soy demasiado perezoso para encontrar una fuente rápida de los 60 días principales por cambio porcentual desde 1970, pero Wikipedia tiene una lista de los mejores días de cada año.por lo que podemos preguntar "Si hubiera invertido en el S&P 500 desde el 01-01-1970 (ignorando los dividendos) pero se perdió el mejor día de cada año, ¿cuánto habría perdido en general?" Si tomamos los mejores rendimientos de un solo día para cada año desde 1970, eso produciría un crecimiento del 440,05%. Si excluimos esos 48 días, los otros 364 días deben haber producido un crecimiento del 467,04 %: (1+4,4005)*(1+4,6704)-1 = 26,2225). Entonces (bastante aproximadamente) la mitad del crecimiento en el índice proviene del mejor día individual de cada año, lo que está más o menos en línea con la afirmación.

Supongo que el Prof. Mandelbrot y Taleb hicieron un análisis mucho más completo que el que hice aquí. Claramente, estaban mirando un período de tiempo diferente al mío, probablemente estaban mirando un índice diferente, no se limitaban a los datos que podían obtener fácilmente de Wikipedia, etc. Pero es interesante que puedas acercarte razonablemente a su número haciendo un cálculo de la parte posterior del sobre utilizando un conjunto de datos muy diferente al que estaban trabajando.

Combinando el mejor día de rentabilidad del S&P 500 cada año

Compuesto de la rentabilidad anual del S&P 500 desde 1970

Gran desarrollo de la idea, y realmente apoya muy bien las declaraciones de los autores al tomar una mirada tan diferente y simplificada a diferentes datos, pero se acerca bastante a lo que dicen. +1
Pero 440% es solo 17% de 2622%. Eso no está ni cerca del 63%.
Aquí hay un sitio para S&P 500 CAGR, que incluye y excluye dividendos. moneychimp.com/features/market_cagr.htm
@RonJohn: los porcentajes de porcentajes realmente no tienen sentido (la declaración en el artículo no es tan precisa en ese punto como preferiría). El mejor día produjo aproximadamente el mismo rendimiento total que los otros 364 días (440 % frente a 467 %). Si convierte eso a una tasa de rendimiento anualizada, el mejor día representaría aproximadamente la mitad del crecimiento total durante 50 años. Mi expectativa es que el artículo en realidad estaba comparando tasas de rendimiento anuales relativas. Estoy haciendo trampa y solo haciendo una comparación aproximada de los dos componentes y diciendo que son más o menos iguales.
Si los porcentajes de porcentajes realmente no tienen sentido, entonces la declaración en cuestión (que no es más que un porcentaje de un porcentaje) no tiene sentido.
@RonJohn: la declaración citada es imprecisa. Supongo que la declaración más precisa es "Diez días de negociación produjeron una CAGR que es el 63% de la CAGR de [algún índice] durante [algún período de 50 años]". Lo cual parece razonable si la CAGR para el mejor día de negociación para el S&P 500 cada año es aproximadamente la mitad de la CAGR del índice en su conjunto (sin incluir los dividendos) entre 1970-01-01 y 2018-12-31.
Tal vez significaron que, en cada uno de los últimos 50 años, los mejores diez días de ese año proporcionaron el 63 % de la rentabilidad de ese año , en promedio.
@RonJohn 440% es 17% de 2622%, pero si elimina 440% de 2622% obtiene 404%. Ese número del 17% es cierto, pero inútil. El hecho de que eliminar el mejor día de cada año le proporcione más beneficios que cualquier otro día es útil.
@Yakk ¿eh? Muy confuso. Por favor, muestra tu trabajo.
@RonJohn Todo el mundo empieza con 1$. Alice obtiene un rendimiento del 2622 % y termina con 27,22 $. Bob pierde la selección de días que devuelven un 440 % juntos y, en cambio, obtiene 27,22 $/5,4 = 5,04 $. Charlie solo invierte en esos días y obtiene 5,40$. Eve se perdió esos días, pero luego tuvo un día de bonificación que por sí solo devolvió el 440 %; Eve termina con el mismo dinero que Alice (27,22 $), y antes del día del bono tenía lo mismo que Bob (5,04 $). Esa selección de 1 día/año generó más ganancias que cualquier otro día juntos.
Posiblemente sea más fácil si utiliza devoluciones a escala. ln(100%+X%) es el retorno a escala ln de una ganancia X%. Entonces, una ganancia del 0% es 0 en escala ln. 440% es 1.686, 2622% es 3.303; aquí, en escala 440% es más de la mitad de 2622%. La diferencia, 1.617 es la escala ln del 404%, que es el rendimiento acumulado de cada dos días. En particular, (100%+440%)*(100%+404%)=(100%+2622%); si tomamos el registro de todo, obtenemos ln(5.4)+ln(5.04)=ln(27.22); en escala ln, devuelve sumar en lugar de multiplicar. Por lo tanto, "la mitad de los rendimientos" en escala ln es reducir a la mitad el valor ; sin ella, "la mitad de los rendimientos" es la raíz cuadrada .
@Justin No es 467.04 es 404ish.
Muy interesante análisis. Pero, ¿no muestra esto que 48 días representan aproximadamente la mitad del crecimiento de los últimos 48 años, mientras que la afirmación es que solo 10 días representan al menos ese crecimiento? No creo que obtengas el mismo crecimiento eligiendo los 10 mejores de esos 48 días, particularmente porque la mayoría de esos 10 mejores días son a finales de los 90 y 00.
@NuclearWang: es al menos plausible que si pudiera reemplazar los rendimientos de varios "mejores días de un año" de un año de baja volatilidad con un solo segundo o tercer mejor día de uno de los años más volátiles. '87 tuvo un día de retorno del 9.1%, si hubiera algunos días del 7 u 8% allí también, eso equilibraría fácilmente varios de los años <2% que se incluyeron. Pero necesitaría obtener más información a nivel diario para confirmar esa suposición.
@RonJohn Fundamentalmente, lo que sucede es que cuando pierde los días que devuelven un 440%, en consecuencia, reduce las ganancias que obtiene en otros días (es decir, pierde toda la capitalización). Si hay dos días en un año con rendimientos del 50 % (el resto son fijos), mi rendimiento anual es del 225 %, pero cuando pierdo uno, mi rendimiento baja al 50 %. Por lo tanto, es más exacto decir que un día representa el 50 % de los rendimientos, aunque el 50 % es solo el 22 % del 225 %.
@mbrig No, el rendimiento anual es del 125 %, no del 225 %. (1 + 0,50) x (1 + 0,50) = 1 + 1,25.
@nanoman ups, cierto. Sin embargo, el principio es el mismo, se pierde la capitalización si se pierde un solo día importante.
Comience su respuesta con "No del todo, pero la afirmación parece ser una cita errónea de M&T" . La brevedad es buena.
Esta es una buena respuesta, pero supone que "comprar, esperar 1 día y luego vender" es la única estrategia comercial. También existen numerosas formas de beneficiarse de los días malos, como a través de la venta al descubierto.
"Pero es interesante que puedas acercarte razonablemente a su número haciendo un cálculo de la parte posterior del sobre utilizando un conjunto de datos muy diferente al que estaban trabajando". -> Como escribió Mandelbrot en su libro, no puedes distinguir cuál representa un día, una semana, un mes, un año o un siglo cuando miras gráficos fractales sin etiquetas.

Nassim Taleb es notablemente brillante. Es su trabajo el que se cita en el artículo. En mi opinión, hay 2 opciones, una cita incorrecta, si el artículo está mal, o un malentendido por parte del lector. Están pasando algunas cosas. Gracias al miembro Justin, arreglé el enlace del artículo de Wikipedia. Recuerdo su afirmación del libro "El Cisne Negro" (p275). Y aquí está -

ingrese la descripción de la imagen aquí

y el cuadro de referencia -

ingrese la descripción de la imagen aquí

Ahora, gracias al miembro Money Ann, quien en realidad notó que el producto de los 10 mejores días fue, de hecho, 64%.

Poniéndome el sombrero de matemáticas, esos diez días, acumulativamente, multiplicaron la riqueza de uno por 1.64. Juego terminado. Si 'no' hubiera estado en el mercado durante los diez días completos, no importa cuánto retroceda ni cuánto avance. Saque esos números y tendrá que dividir su riqueza entre 1,64. (El único argumento que uno podría tener es que, por ejemplo, los depósitos se hacen en el camino, yo, por ejemplo, solo comencé a invertir en 1984, por lo que los números anteriores no importan. Esa es una distracción, no el objetivo del largo plazo observación).

Para simplificar mis ejemplos, digamos que hubo un día en que el S&P subió un 10 % (para facilitar las matemáticas). Y tenemos el 4300% de rendimiento a largo plazo que cita Money Ann. Elimine eso un día y solo tendrá un 3909% de retorno. No 4290%.

Entonces, de hecho, no es de extrañar, la cita es precisa, aunque en el libro, Taleb es más vago.

Si mi respuesta aquí necesita alguna aclaración, con gusto lo haré. Comente y devolveré, editaré y limpiaré los comentarios.

Editar - en respuesta al comentario de Dennis. Digamos que hubo una caída y, justo después, el mercado se recuperó un 50 % en solo un día. En un historial de rendimientos diarios, ahora tendríamos 1,5 como factor. Ahora, durante un largo período de tiempo, décadas, vemos que el mercado sube un 1900 %, es decir, el resultado de la multiplicación es 20, ya que cambiamos de porcentajes a factores. Quite el 1.5 y el resultado es simplemente 10, o un crecimiento del 900%. Ese día, dentro o fuera, marcó una gran diferencia. Le corresponde al lector mantener la mente abierta y darse cuenta de que no se necesitan demasiados días para multiplicar para obtener ese 50%. De hecho, ni siquiera son 10. La moraleja de la historia de Taleb es simplemente que comerciar, entrar y salir del mercado es un riesgo mayor que permanecer en él a largo plazo. (Y tenga en cuenta a Dennis: mhoran ya hizo el mismo ejemplo matemático del 50%. Esto es lo mismo en mis propias palabras).

Entonces, la paráfrasis NO es exacta. Esos 10 días representan un 64% de retorno. Declaración independiente. No tiene ninguna relación con el retorno de los otros 49,95 años, por lo que expresarlo como "64% de los retornos de los últimos 50 años" no sirve para nada, excepto para inducir a error.
Ben, ¿estás sugiriendo que Taleb es engañoso o que mi explicación de su declaración es defectuosa?
Estaba hablando de la cita en la pregunta, que parafrasea a Taleb. Pero el fragmento de libro que se muestra en su respuesta (la prosa, no la trama) sugiere la afirmación errónea ... Podría haber usado una palabra más fuerte, pero no hay nada de malo en su descripción "vaga".
Estoy de acuerdo con Ben: la mitad de la devolución debería significar la raíz cuadrada del multiplicador. De lo contrario, puede tener un escenario ridículo en el que puede haber muchos conjuntos de días inconexos, cada conjunto con "la mitad de los rendimientos".
Aunque no está mal, el ejemplo del 10% me distrae, considere convertirlo en un número grande como el 50%.
@DennisJaheruddin - listo.
@BenVoigt "engañar" lo dice amablemente. Si las acciones se desploman y se recuperan en un 50 % en 2 horas, es completamente erróneo decir que "el 50 % de sus devoluciones" fue en 1 hora. Solo es realmente una buena métrica si la acción no subió por encima del punto más bajo antes, o se hundió por debajo del punto más alto después del aumento del 63%. De lo contrario, podría multiplicar los mejores 1000 milisegundos individuales y afirmar que el 90 % de su retorno fue causado por el mejor segundo durante los últimos 90 años.
@ReinstateMonica ese es otro factor. Si su riqueza aumentó 8 veces, ha habido al menos 3 eventos que son responsables de "la mitad de su retorno".
me pregunto por cuánto multiplicarías tu riqueza si te perdieras los 10 peores días
Los peores 10 días de retorno del último siglo se multiplican a .3078. Quitar esto de la cadena multiplica por el recíproco, o 3.25X el valor de mercado neto. Pero tenga en cuenta que 4 de los días fueron de 1929 a 1937.

Dado que el libro fue escrito en 1997, el período relevante sería aproximadamente 1947-1996. Los datos de Yahoo Finance comienzan en 1950, por lo que, en su lugar, analizaré los "últimos 47 años". Presumiblemente, el hallazgo de Mandelbrot y Taleb no es tan trivial que ya no se aplicaría ni siquiera a un período de tiempo ligeramente diferente.

El 3 de enero de 1950, el S&P cerró en $16,66. El 31 de diciembre de 1996 cerró $ 740,74. Esto es un aumento del 4300% en total. Los mejores días fueron:

1987-10-21  9.10%
1987-10-20  5.33%
1970-05-27  5.02%
1987-10-29  4.93%
1982-08-17  4.76%
1962-05-29  4.65%
1974-10-09  4.60%
1957-10-23  4.49%
1974-10-07  4.19%
1974-07-12  4.08%

Esto suma el 50%. Tal vez lo que se quiere decir es que si solo hubiera operado en los 10 mejores días, obtendría la mayor parte de las ganancias. Para comprobar que podemos tomar el producto y obtener un aumento del 64%. Por lo que puedo decir, la afirmación tal como se presenta parece ser falsa. Ni Mandelbrot ni Taleb son generalmente considerados tontos o charlatanes, así que asumo que algo se perdió en la traducción. Es interesante que el 64% que obtuve estaba muy cerca del 63% citado.

63% de 4300% es 2709% (si tomar el porcentaje de un porcentaje te confunde, solo piensa en ganar $4300 por cada $100 que pones y tomar el 63% de eso). Para obtener esta ganancia operando solo en los mejores días, necesitaría comerciar en aproximadamente 115 días que van desde 1950 hasta 1991. Curiosamente, si operó solo en los mejores días, su ganancia máxima sería de aproximadamente 3*10^12%. desde la negociación en 10240 de 11826 días de negociación en el conjunto de datos.

Por cierto, si operara en los 20 peores días, perdería dos tercios de su dinero. Su perspectiva solo mejora si operó en los peores 10040 días, en cuyo caso también perderá dos tercios. Puede perderse como máximo 140 de los mejores días si quiere al menos alcanzar el punto de equilibrio, suponiendo que opere cada dos días.

Por interesante que sea debatir toda esta aritmética, la segunda parte de su pregunta es más útil para discutir:

¿O es incluso justo preguntar si esto es cierto?

Realmente no importa exactamente cuáles son los números. El punto de los autores es que existe una distribución exponencial en los rendimientos del mercado de valores, donde gana o pierde grandes sumas en una minoría de días, mientras que la mayoría de los días realmente no lo afectan de una forma u otra. Por supuesto, las colas "largas" o "gordas" en las distribuciones de rentabilidad del mercado son bien conocidas. En la naturaleza, casi todo está distribuido de tal manera que los eventos extremos son raros y los eventos comunes son pequeños. No tenemos muchos fenómenos donde la mayoría de los valores estén muy alejados de la media o mediana, el mercado no es una excepción. El debate que Mandelbrot y Taleb abordan aquí es con respecto a la probabilidad exacta de que un evento improbable determinado sea 10 ^ -9 frente a 10 ^ -10 frente a 0. Puede parecer académico, pero en algunos casos puede hacer una gran diferencia.

Usando sus cifras, para los 10 mejores días para entregar el 63% del 4300% en devoluciones, tendrían aumentos diarios del 46% si fueran todos iguales. Como se puede ver en los datos de esta respuesta (o la respuesta de Justin Cave), no hay un solo día (ni siquiera un solo año) que ofrezca este tipo de rendimiento.
Hola Ann, por favor mira mi respuesta. Hiciste todo el trabajo pesado, pero llegaste a la conclusión equivocada. La clave estaba en notar que los rendimientos se multiplican.
1,0408 * 1,0419 * 1,0449 * 1,0460 * 1,0465 * 1,0476 * 1,0493 * 1,0502 * 1,0533 * 1,0910 = 1,64544351855912
"63% de las ganancias" bien puede significar pow(43.00, 0.63) no 43.00 * 0.63. Usando esta interpretación, sería solo un factor de 10.69, no 27.09. Todavía muy por encima del factor 1.64 de los mejores 10 días.
Comience con $100, 4300% de retorno le da $4400; elimine los rendimientos compuestos como los calculó Joshua y tendrá $2674 para un rendimiento del 2574%. 2574/4300 es del 62 %, por lo que el 38 % de las devoluciones son atribuibles a los 10 días principales. Ese no es el 63% en cuestión, pero sigue siendo una proporción significativa.
@BenVoigt Tampoco creo que sea una interpretación correcta de la afirmación del autor. Dividirá el saldo final por el rendimiento de los 10 días principales para eliminar su influencia. ((43+1)/1.645-1)/43 -> ~60 % de retorno sin los 10 días principales = 40 % de los 10 principales. Sin embargo, no estoy seguro de cómo el autor llegó al 63 %.
@jcaron Correcto, aunque, de nuevo, supongo que la negociación es comprar al cierre y vender al cierre. Si tuviera que tener en cuenta los máximos/mínimos intradiarios, el resultado podría ser diferente, pero los datos intradiarios tan antiguos no son fáciles de obtener.
@JoeTaxpayer En realidad, multipliqué los rendimientos en todos los casos, excepto el primer 50% que menciono justo después de la tabla. Usé un producto en ejecución para ser exactos (" ¿y si operé solo en los n mejores días ?"). En cuanto a estar equivocado en mi conclusión, diría que mi punto está captado por el último párrafo, que no creo que sea falso.
@BenVoigt Probablemente en este punto, el siguiente paso sería leer la sección de métodos del texto relevante, que lamentablemente no tengo tiempo para hacer en este momento. Sin embargo, según mi último párrafo, no creo que sea muy importante para la pregunta del OP en ningún caso.
No creo que signifique "63 % del 4300 % es 2709 %", creo que significa del 4300 %, el 63 % provino de los mejores diez días y el 4237 % restante provino de los otros 13 000 días de operaciones en el periodo de 50 años. probablemente ha sido un poco mal citado.

Simplifiquémoslo, nuestra inversión de ejemplo es muy aburrida excepto por un día en que se vuelve loca.

Dos inversionistas con la misma inversión inicial de $1,000, el mercado se duplica cada 7 años excepto por un día al final de los primeros 7 años cuando sube un 50%. El primer inversor invierte durante todo el período, el segundo inversor se salta solo un día.

Inversor 1:

  • Comienza con $1,000
  • 7 años después $2,000 (2x)
  • Día loco con un aumento del 50% termina con $3,000
  • 28 años después $48,000 (16x)

Inversor 2:

  • Comienza con $1,000
  • 7 años después $2,000 (2x)
  • Se pierde el día loco pero luego vuelve a entrar en el mercado todavía a $ 2,000
  • 28 años después $32,000 (16x)

El inversor uno ve que la inversión inicial aumenta 48x o 4700% El inversor B ve que el valor aumenta 32X o 3100%. Entonces ese 1 día con un 50% borraría alrededor del 50% de las ganancias a pesar de que el inversionista desafortunado vio una ganancia del 3100%.

Encontré una frase similar en un artículo en el sitio web de Motley Fool.

Tiempo en el mercado versus tiempo fuera del mercado

La Guía de jubilación de 2019 de JP Morgan Asset Management muestra el impacto que tiene en una cartera la salida del mercado. Mirando hacia atrás en el período de 20 años desde el 1 de enero de 1999 hasta el 31 de diciembre de 2018, si se perdió los 10 mejores días en el mercado de valores, su rendimiento general se redujo a la mitad. ¡Esa es una diferencia significativa para solo 10 días durante dos décadas!

El estudio de JP Morgan se puede encontrar en su sitio web . La página 41 del informe tiene información.

Bonito, fácil de seguir, ejemplo. A veces, solo mostrar números simples, la ganancia única del 50%, realmente puede aclarar las cosas.

No puedo hablar de los métodos de investigación utilizados en ese estudio, pero Taleb probablemente estaba tratando de desarrollar su hipótesis del "cisne negro" al mostrar que los días de negociación del "cisne negro" tienen el mayor impacto en el mercado en general.

Las matemáticas detrás de los análisis de Mandelbrot y Taleb siempre me pasan por alto, aunque soy fanático del trabajo de Taleb desde un punto de vista filosófico.

Tony Robbins simplificó este concepto al imponer la idea de que no se puede cronometrar el mercado de valores. No estoy seguro de quién hizo la investigación, pero muestra que si tratas de cronometrar el mercado y te pierdes los días de mayor rendimiento, en última instancia, obtienes un rendimiento inferior al del mercado.

ingrese la descripción de la imagen aquíFuente de la imagen: MarketWatch

Me pregunto cómo se ve el reverso (excluyendo los peores 10/20/40 días)
@BenVoigt Ese es un buen punto. Me encantaría ver esa información.
Los datos, que se pueden descargar fácilmente desde 1950 en Yahoo, están listos para su análisis. Las hojas de cálculo son mis amigas.

Quizás sea cierto, pero no es evidencia de que los retornos no sean normales. Estoy de acuerdo en que normalmente no se distribuyen, pero no estoy de acuerdo con el razonamiento. Como señalaron otros, si el rendimiento de los diez días principales es del 63 %, la afirmación es cierta independientemente del rendimiento de los otros días. Esto se puede lograr con una distribución normal suficientemente volátil. Si la desviación estándar de los rendimientos es baja y se logra, en conjunto puede ser evidencia de fuertes colas. De forma aislada, no lo es.

La secuencia de comandos simple a continuación genera rendimientos normales, de modo que los 10 días principales tienen un rendimiento de aproximadamente el 70%. Ajustar el parámetro de desviación estándar mostrará la relación.

import numpy as np

n_simulations = 5000
n_days_per_year = 250
n_years = 50
n_days = n_days_per_year*n_years
mean = 0.1/n_days_per_year
std_dev = 0.25 / n_days_per_year**0.5

rnds = np.random.normal(size=(n_days,int(n_simulations/2)))
rnds = np.concatenate((rnds,-rnds),axis=1) # antithetic

returns = mean + std_dev*rnds

sorted_returns = np.array([np.sort(returns[:,i_simulation]) for i_simulation in range(n_simulations)]).T
top_ten_returns = np.product(1+sorted_returns[-10:,:],0) - 1
print(np.mean(top_ten_returns))

He visto muchas afirmaciones de esta naturaleza. Sospecho que la mayoría de ellos han hecho la aritmética correctamente. Para lo que se usa aquí es para afirmar que la distribución normal es un mal modelo de la realidad lejos de la media, porque los eventos que superan muchas desviaciones estándar son mucho más comunes de lo que afirmaría la distribución normal. La distribución normal es muy conveniente porque tenemos muchos teoremas sobre lo que sucede cuando las cosas se distribuyen normalmente. Siempre que se mantenga cerca de la media, no importa mucho qué curva en forma de campana use. Cuando vas lejos importa mucho. En la vida real, las colas son siempre mayores de lo que diría una distribución normal.

El hecho de que la aritmética sea correcta no nos dice cómo reaccionar ante el hecho. A menudo se cita para decirle que no intente cronometrar el mercado, porque si pierde los mejores 10 días, perderá gran parte del rendimiento. Por otro lado, si te pierdes los 10 peores días, tu retorno sube mucho. No se ofrece ninguna justificación de que tratar de cronometrar el mercado hace que sea más probable que te pierdas los grandes días que los días terribles.

tl;dr - Esta afirmación es falsa. Si bien es cierto que un inversionista que compró al comienzo de cada uno de los 10 días principales y luego vendió al final de ellos, podría disfrutar de ganancias del 64% sobre un inversionista similar que no participó en esos 10 días, es No se deduce que estos 10 primeros días " representan el 63 por ciento de los rendimientos de los últimos 50 años " .


La reclamación es incorrecta debido a un marco roto.

Imagina que alguien te dice que la mejor estrategia para tu futuro financiero es usar cierta estrategia para jugar al póquer en un casino de Las Vegas. Es posible que tengan razón acerca de que su estrategia es óptima, en un marco que asume que usted va a apostar su futuro financiero en un casino. Pero, ¿es entonces cierto que la estrategia óptima para su futuro financiero pasa por jugar al póquer en un casino de Las Vegas?

No es que la afirmación sobre cómo jugar al póquer sea necesariamente incorrecta, pero el marco que la rodea sí lo es. Asimismo, el título de esta pregunta pregunta:

¿Es cierto que “solo diez días hábiles representan el 63 por ciento de los rendimientos de los últimos 50 años”?

Esa cifra del " 63 por ciento " puede provenir de operaciones matemáticas realizadas correctamente, pero el marco sugiere que alguien que se perdió esos 10 días solo podría esperar disfrutar del 37% restante de los rendimientos en los últimos 50 años.

El problema es que generalmente es inapropiado afirmar que los miembros de algún conjunto constituyen una parte del total de ese conjunto cuando ese conjunto no solo suma valores positivos. (Más sobre las matemáticas al final de esta respuesta).

Por ejemplo, siguiendo los números de Wikipedia , parece que un inversionista que se saltó los peores 5 días habría aplicado una ganancia de ~79.4% a su riqueza. Pero, ¿tiene sentido atribuir ~79,4 % de la riqueza a saltarse los peores 5 días y al mismo tiempo atribuir el 63 % de la riqueza a estar presente durante los mejores 10 días?


Analogía: ¿Un empleado hizo el 90% del trabajo de una operación pequeña?

Considere una pequeña empresa con 25 empleados. Hacen pequeños trabajos por contrato.

Un empleado, Bob, tiene un papel secundario como especialista en el 90 % de los proyectos; el otro 10% no involucra su área de especialización. Bob luego escribe en su currículum:

Mis esfuerzos representaron el 90% de la productividad de la empresa durante mi gestión.

Lo que hace que parezca que él hizo el 90% del trabajo y todos los demás hicieron el 10%, ¿verdad? ¡Claramente es un empleado de primer nivel!

Y no está mintiendo, en el sentido de inventar números. Esa cifra es precisa, para el marco en el que se calculó.

El problema es que el marco está roto. Es decir, no tiene sentido que Bob describa su participación en el 90% de los proyectos como representando el 90% del trabajo de la empresa. No es que haya hecho mal las matemáticas, es que la lógica detrás del modelo en sí es un poco tonta.


Afirmación corregida: invertir en los 10 mejores días generaría un rendimiento de ~64%.

Parece que, si un inversionista invirtió al comienzo de un día y luego se retiró al final de cada uno de los 10 días principales, habría aplicado un factor de ~164%, para una ganancia de ~64%.

Sin verificar las matemáticas o las cifras, eso me parece plausible. Pero, suponiendo que sea cierto, se vuelve falso si tergiversamos esa afirmación a través de una redacción que hace que parezca que esto es algo en lo que es significativo atribuir el 64% de las ganancias a 10 días específicos, de modo que cualquiera que se haya perdido esos 10 días específicos solo puede Esperamos disfrutar del 36% de las ganancias, o algo así.

No es que alguien haya hecho mal las matemáticas o se haya equivocado al calcular la cifra; más bien, es que el marco del modelo en el que existe la figura está roto. La solución correcta es salir de ese cuadro.


Discusión: Explicación matemática.

Cuando decimos que algo contribuye x % a un total, normalmente estamos trabajando dentro de un marco en el que estamos sumando un montón de valores positivos para llegar a un total.

Podemos hacer que estas inversiones sean aditivas. Específicamente, podemos tomar el logaritmo natural de la razón de cada día para llegar a un parámetro aditivo. Luego, podemos sumar esos parámetros aditivos, elevar el número de Euler a la potencia de su suma, y ​​ese es el factor total.

Para tomar la tabla de la respuesta de @MoneyAnn , luego amplíela:

  Date         +%       factor     ln(factor)
-----------------------------------------------------
1987-10-21    0.0910    1.0910    0.0870947068509337
1987-10-20    0.0533    1.0533    0.0519280928603591
1970-05-27    0.0502    1.0502    0.0489806222216219
1987-10-29    0.0493    1.0493    0.0481232751817282
1982-08-17    0.0476    1.0476    0.0465018336514199
1962-05-29    0.0465    1.0465    0.0454512629039174
1974-10-09    0.0460    1.0460    0.0449733656427312
1957-10-23    0.0449    1.0449    0.0439211870579281
1974-10-07    0.0419    1.0419    0.0410459694360010
1974-07-12    0.0408    1.0408    0.0399896482161584
                                  ------------------
                        Total:    0.498009964

Entonces exp(0.498009964)es 1.645443519, que recupera ese 1.64factor ~, o ~ 64%, al que se referían otras respuestas.

Sin embargo, el cuadro roto presentado en la reivindicación tiene 2 grandes problemas:

  1. Los factores no se suman en todos los días.
    Si alguien quisiera hacer una afirmación como esta, debería haber ln(factor)marcado todos los días y luego dividido la suma de esos parámetros para los 10 días principales por la suma de esos parámetros para todos los días.

  2. Los factores contienen negativos.
    Algunos días terminaron más bajos de lo que comenzaron. Por ejemplo, aparentemente 1987-10-19 tuvo un éxito de -20,47%, para un ln(factor) ~= ln(1-0.247) ~= -0.231553819. En general, para cualquiera factorde menos de 1, ln(factor)debe ser negativo.

Podríamos tratar de arreglar los números para dar cuenta del Problema #1, pero el marco no se presta para resolver el Problema #2.

Para notarlo, los autores originales aparentemente estaban tratando de aclarar cómo las distribuciones podrían ser no normales. Este punto general que estaban tratando de hacer es muy correcto. Es la afirmación específica sobre la que se preguntó en esta pregunta que se expresó tan mal que podemos descartarla como falsa.

Aquí hay mucha exégesis matemática excelente, pero mirando más ampliamente, parece haber dos motivaciones principales que las personas tienen para hacer estos comentarios sobre los "mejores días".

Uno es el punto de Nick Taleb de que las 'colas gordas' significan que la distribución de los rendimientos se concentra (para bien o para mal) en unos pocos incidentes. Esto parece válido.

También lo encontrará como un argumento en contra de retirarse del mercado en períodos de volatilidad. Este no es realmente un argumento válido; más bien ignora el punto de que si, en cambio, se encontrara en los "peores días" del mercado, estaría sufriendo enormes pérdidas. (lo que no quiere decir que la conclusión sea incorrecta, solo el argumento)

(Para su información, si está interesado en los rendimientos del mercado de valores a largo plazo, la persona indicada es Elroy Dimson, profesor de LBS y Judge Instittue. Ha analizado esto en varios países y períodos).