Resolviendo problema de cumpleaños sin complemento

Estoy tratando de encontrar la probabilidad de que al menos 2 personas en una habitación de 4 compartan el mismo cumpleaños (sin usar complementos).

Empecé por dividir el problema en 4 casos:

Sea E = el evento de que al menos 2 personas compartan el mismo cumpleaños en una habitación de 4.

Nuestro tamaño de muestra: 365 4

Caso 1: 4 personas comparten el mismo cumpleaños: 365 maneras

Caso 2: 3 personas comparten el mismo cumpleaños, 1 cumpleaños distinto: 365 364 C ( 4 , 3 )

Caso 3: 2 personas comparten cumpleaños, otras 2 personas comparten algún otro cumpleaños: 365 364 C ( 4 , 2 ) 2

Caso 4: 2 personas comparten el mismo cumpleaños, 2 cumpleaños distintos: 365 364 363 C ( 4 , 2 ) 2

Después de sumar todos los casos y dividir por el tamaño de la muestra para encontrar la probabilidad, la respuesta tuvo un exceso de conteo. Revisé mi respuesta haciendo

PAG ( mi ) = 1 365 364 363 362 365 4

¿Dónde tuve un conteo excesivo? ¡Gracias!


Aquí hay un ejemplo que funciona con n = 3 personas y al menos 2 personas comparten el mismo cumpleaños.

Caso 1: 3 personas comparten el mismo cumpleaños: 365

Caso 2: 2 cumpleaños iguales, 1 diferente: 365 364 ( 3 2 )

PAG ( mi ) = 365 + ( 365 364 ( 3 2 ) ) 365 3 1 365 364 363 365 3

Ambas son respuestas equivalentes porque en el complemento estamos restando el evento de que todos los cumpleaños son distintos.

Le aconsejo que sea más explícito en la forma en que dividió/sumó para corregir el conteo excesivo.
Caso tres. Las cuatro personas se nombran., digamos Alfred, Bobby, Carlos y Dan. Elige el cumpleaños de Alfred. Elige quién más comparte el cumpleaños de Alfred. Elija el cumpleaños de las dos personas restantes. Hay 365 364 3 resultados aquí, no 365 364 6
Para el Caso 3, creo que estás contando en exceso. Estás contando los pares de cumpleaños dos veces, simplemente nombrándolos en un orden diferente...
¿Por qué hay un 2 al final del Caso 4?
@ user1813840 Pero [YYXX] es lo mismo que [XXYY], para una elección diferente de X e Y. ¿No debería haber un factor de 1/2 en alguna parte para dar cuenta de esta simetría?
Gracias chicos, obtuve la respuesta correcta eliminando el 2 en el caso de 4 como sugirió Erick y cambiando el 6 a un 3 como sugirió JMoravitz.
@ErickWong La razón por la que agregué 2 es porque [XYZZ] y [YXZZ]? no son diferentes? Sin embargo, tiene razón acerca de no necesitarlo, pero ¿por qué no?
@user1813840 Imagine que está escribiendo cada combinación exactamente una vez completando varias plantillas como [XYZZ]. Está diciendo que necesita contar ambas plantillas [XYZZ] y [YXZZ]. Pero cualquier lista de fechas que se ajuste a la primera plantilla (digamos, [Pascua, Navidad, Año Nuevo, Año Nuevo]) también se ajusta a la segunda. ¡Eso es contar dos veces!
@ErickWong La razón por la que todavía estoy confundido es porque la forma en que lo entendí es, [XYZZ] es que X está fijando una fecha para la persona 1, Y para la persona 2, ..., Z para la persona 4. Entonces, habiendo cambiado [XYZZ] ] a [YXZZ] ¿es ahora una posibilidad diferente de asignar las fechas? Porque si miramos el ejemplo del caso 2, contamos [YXXX] como diferente de [XXXY]
@ user181340 ¿Entiende que mi ejemplo de Pascua se ajusta tanto a [XYZZ] como a [YXZZ], verdad? Ahora intente pensar en un ejemplo que se ajuste tanto a [YXXX] como a [XXXY]. Es imposible. La diferencia se vuelve obvia cuando realmente intentas con fechas específicas.
@ErickWong Finalmente lo entendí, muchas gracias :)

Respuestas (2)

Al probar una nueva forma, es prudente buscar una clase familiar de problema, como lanzamientos de dados en Yahtzee, (excepto que aquí es un problema). 365 dado de una cara lanzado 4 veces.)

Luego podemos "encamisarlo" en un formato como [Elegir caras para que aparezcan] × [Permutar]

Hay cuatro posibilidades:

4 o F a k i norte d : [ ( 365 1 ) ] × [ 4 ! 4 ! ]

3 1 o F a k i norte d : [ ( 365 1 ) ( 364 1 ) ] × [ 4 ! 3 ! 1 ! ]

2 2 o F a k i norte d : [ ( 365 2 ) ] × [ 4 ! 2 ! 2 ! ]

2 1 1 o F a k i norte d : [ ( 365 1 ) ( 364 2 ) × [ 4 ! 2 ! 1 ! 1 ! ]

Sume para obtener formas favorables y divida por 365 4 para obtener el resultado final.

No vi los comentarios de BruceET en ese momento, pero los encontré hoy. He contrastado con la fórmula usando el complemento y encontré que los dos coinciden exactamente.

Asumiendo 365 cumpleaños igualmente probables, aquí hay una simulación de 10 millones de realizaciones del número de cumpleaños únicos X de 4. Podría ayudarlo a resolver el problema del conteo excesivo.

m = 10^7;  x = numeric(m)
for (i in 1:m) {
   room = sample(1:365, 4, repl=T)
   x[i] = length(unique(room))  }
table(x)/m
x
        2         3         4 
0.0000510 0.0163006 0.9836484 

Note ese evento { X = 1 } no ocurrió ni una sola vez en 10 millones de 'habitaciones'. No es realmente sorprendente; su probabilidad es solo 2.056465e-08. Probabilidades de X = 3 y 4 debe tener una precisión de tres lugares.

Anexo (después de un voto negativo inexplicable): el Caso 4 de OP tiene un factor incorrecto de 2 según lo comentado por @ErickWong (que solicitó y está de acuerdo con mi simulación). Este es también el caso de @trueblueanil 2-1-1, que de nuevo concuerda con mi simulación PAG ( X = 3 ) 0.016. (+1) [Además, sdding casos 3-1y 2-2da menos de .0001, como en la simulación para PAG ( X = 2 ) . ]