Probabilidad de que al menos 333 personas compartan el mismo cumpleaños en un grupo de nnn personas

Descargo de responsabilidad: he visto publicaciones con buenas respuestas para el caso de "al menos 2 gente", o "exactamente 2 personas". Publicaciones con "al menos k personas" generalmente suponen que el cumpleaños mutuo es un día fijo (es decir, el 2 de enero) y aplican la distribución binomial. Esta publicación tiene que ver con la probabilidad de 2 personas que comparten el mismo cumpleaños (aleatorio) en un grupo de norte gente.


Intentar:

La probabilidad de al menos 2 personas que tienen el mismo cumpleaños en un grupo de norte personas es el complemento de la probabilidad de que todos tengan un cumpleaños diferente. Eso es:

pag ( norte , k 2 ) = 1 365 364 ( 365 norte + 1 ) 365 norte
Ahora, supongamos que queremos encontrar pag ( norte 3 ) . Al hacer la suposición de que 2 las personas ya tienen el mismo cumpleaños, podemos tratar a estos dos como una sola persona. Entonces la probabilidad de al menos 2 personas que comparten el mismo cumpleaños en un grupo de norte 1 la gente es:
pag ( norte 1 , 2 ) = 1 365 364 ( 365 norte + 2 ) 365 norte 1
Entonces, estoy pensando en encontrar la probabilidad pag ( norte , k = 2 ) de exactamente 2 personas que comparten el mismo cumpleaños en un grupo de norte personas y de alguna manera calcular:
pag ( norte , k 3 ) = pag ( norte 1 , k 2 | norte , k = 2 )
pero posiblemente me equivoque. ¿Alguna idea?

La razón por la que la gente tiende a no escribirlo es que en general se vuelve muy confuso. k , norte . Incluso para 3 , norte , es complicado porque debe considerar la posibilidad de que dos personas no comparten un cumpleaños, exactamente dos comparten un cumpleaños, exactamente dos pares de personas comparten cumpleaños (aunque no el mismo cumpleaños) y así sucesivamente. No es un cálculo difícil en una máquina, pero difícil de hacer con lápiz y papel.

Respuestas (2)

Por lo que puedo decir, sus métodos no funcionan y no se pueden salvar.

Este es un problema difícil que no se puede resolver por medios convencionales. Para encontrar la probabilidad de que al menos tres personas tengan un cumpleaños en común, calculemos la probabilidad de que tres personas no tengan un cumpleaños en común. esto es igual a

(1) norte ! [ X norte ] ( 1 + X + X 2 / 2 ) 365 365 norte .
Aquí, [ X norte ] F ( X ) es el coeficiente de X norte en el polinomio F ( X ) . Quieres uno menos el anterior. Otra forma de escribir esto es
(2) a 1 , a 2 , , a 365 1 365 norte norte ! a 1 ! a 2 ! a 365 ! .
donde la suma varía sobre todos los vectores ( a 1 , a 2 , , a 365 ) de números enteros entre 0 y 2 cuya suma es norte . Esto funciona porque cada vector especifica una distribución válida de cumpleaños donde ningún cumpleaños se repite tres veces o más, y el coeficiente multinomial da el número de selecciones ordenadas de cumpleaños que tienen esa distribución, y luego cada uno se multiplica por la probabilidad ( 1 / 365 ) norte de que ocurra esa selección ordenada. Puedes comprobarlo cuando te expandas ( 1 ) y colecta el coeficiente de X norte , obtienes exactamente ( 2 ) .


Si está de acuerdo con un resultado aproximado, la cantidad esperada de trillizos de personas que comparten un cumpleaños común es λ = ( norte 3 ) 1 365 2 , y el número de trillizos con un cumpleaños común es aproximadamente Poisson con parámetro λ . Por lo tanto, la probabilidad de que algún trillizo comparta un cumpleaños es aproximadamente

1 mi ( norte 3 ) / 365 2 .

¿Podría dar más detalles sobre cómo obtuvo el primer resultado, también conocido como la probabilidad de que tres personas no compartan un cumpleaños?
@LoneBone Ver edición.

Si bien no existe una fórmula simple para la expresión exacta dada en la ecuación de Mike Earnest (2), existen formas eficientes de evaluarla para cualquier   norte   , en uno de los cuales se ha implementado el paquete pmultinomdel lenguaje de programación estadística R . Aquí hay un programa R para comparar las probabilidades exactas de que al menos tres personas tengan un cumpleaños en común con la aproximación de Poisson para norte = 90   a   100   :

library(pmultinom)
us<-1:365
ps<-1:365
for (i in 1:365){
  us[i]<-2
  ps[i]<-365^(-1)
}
for(n in 90:100){
  a = 1-pmultinom(upper=us,size=n,probs=ps,method="exact")
  b=1-exp(-n*(n-1)*(n-2)/(6*365^2))
  v<-c(n,a,b)
  print(v)
}

Ejecutarlo en línea aquí produce los siguientes resultados:

norte exacto Veneno aprox. 90 0.5341956 0.5859698 91 0.5456984 0.5982312 92 0.5571482 0.6103927 93 0.5685366 0.6224440 94 0.5798554 0.6343752 95 0.5910964 0.6461763 96 0.6022517 0.6578381 97 0.6133135 0.6693514 98 0.6242745 0.6807075 99 0.6351272 0.6918979 100 0.6458645 0.7029148
Entonces, para este rango de valores, la aproximación de Poisson es aproximadamente 10 % demasiado largo.