Tienes 20 objetos diferentes en una bolsa y eliges 10 veces, cada vez que vuelves a colocar el objeto en una bolsa. La simulación Monte-Carlo (ver más abajo) muestra que, en promedio, se seleccionan alrededor de 8 objetos únicos. Pero, ¿cuál es la respuesta exacta? De manera más general, elija m veces entre n objetos (con reemplazo). ¿Cuál es el promedio? ¿Cuál es la distribución resultante?
Aquí está el código de matlab:
% Choose m times out of n objects (with replacement).
% Output average and distribution
n=20;
m=10;
S=[];
for t=1:10000,
S(end+1) = numel(unique(randi(n,m,1)));
end;
hist(S, 1:n)
mean(S)
Numera los objetos con .
Para dejar tomar valor si objeto se elige al menos una vez y se deja que tome valor de lo contrario.
Por linealidad de expectativa y simetría encontramos para (es decir, el número total de objetos que se seleccionan al menos una vez) que:
Editar en distribución:
Para encontrar la distribución de la cantidad de objetos que se seleccionan, puede aplicar la inclusión/exclusión. Si y y por ejemplo queremos encontrar entonces al principio observe que:
Ahora queda por encontrar .
Observa eso:
Resolver esto con inclusión/exclusión y simetría da:
Entonces terminamos con:
Clasificando por el número de objetos que aparecen obtenemos la siguiente probabilidad para objetos:
Para comprobar que se trata de una distribución de probabilidad debemos obtener una cuando sumamos todas las probabilidades:
Podemos agregar porque no contribuye al extractor de coeficientes:
El cheque pasa. Ahora para el promedio obtenemos
Esto es equivalente a: Lugar bolas en urnas, con probabilidad uniforme; ¿Cuántas urnas están ocupadas?
Otras respuestas dan la distribución exacta (que involucra números de Stirling del segundo tipo).
Para grande , la distribución se puede aproximar por iid variables con distribución de Poisson, y
Alquiler sea el número de urnas ocupadas, tenemos
es decir, un binomio con
Entonces su expectativa es (bajo esta aproximación) . Que es asintóticamente equivalente con el valor exacto