Problema combinatorio: bolas negras y blancas divididas en k grupos con límites, y luego seleccionando una secuencia de solo bolas negras.

Tengo el siguiente problema combinatorio: Supongamos que tenemos norte pelotas: W blanco y B bolas negras ( norte = B + W ).

Paso 1: Lo primero que hacemos es dividir aleatoriamente estos norte bolas en k contenedores, cada contenedor tiene norte = norte k pelotas. Por supuesto, la división de las bolas en los contenedores se realiza sin reemplazo.

Paso 2: ahora, una vez que las bolas se dividen entre los contenedores, seleccionamos al azar una bola de cada contenedor (es decir, sacamos k bolas, una de cada caja, al azar).

Ahora, la pregunta es : ¿cuál es la probabilidad de que todas las bolas extraídas sean negras? Llamemos a este evento mi .

Traté de buscar en el foro algunas sugerencias, pero no encontré este tipo de pregunta. Encontré ese: pregunta combinatoria restringida: 2 tipos de bolas divididas en k grupos con límites , que me dio algunas pistas pero aún no era lo que estaba buscando.

Este es mi pensamiento:

  • Calculé todas las formas posibles de dividir las bolas como:

    ( norte norte ) ( norte norte norte ) ( norte 2 norte norte ) ( norte ( k 1 ) norte norte ) = norte ! 2 norte !
    me salteo la papelera k ya que en mi opinión solo hay una forma de poner norte bolas allí - y estas son las norte bolas restantes. Sin embargo, mi preocupación aquí es que la variable k se canceló en esta ecuación, y me pregunto si eso está bien.

  • Ahora, el Paso 2 puede ocurrir con una probabilidad distinta de cero solo si al menos 1 la bola negra está en cada contenedor. La distribución hipergeométrica me permite "formular la probabilidad de s éxitos (es decir, sorteos aleatorios, para los cuales el objeto extraído tiene una característica específica) en metro extrae, sin reemplazo, de una población de tamaño METRO que contiene exactamente S objetos con esa característica, donde cada sorteo es un éxito o un fracaso". Así que pensé que podía usar esto en el Paso 1 cuando estoy asignando bolas aleatoriamente a los contenedores. El éxito sería poner una bola negra en un contenedor. Así que usando la notación de mis bolas blancas y negras, dicha probabilidad se define como

    PAG r ( X = X ) = ( B X ) ( norte X norte X ) ( norte norte ) .
    Y pensé que entonces la probabilidad de que un contenedor contenga al menos 1 bola negra se expresaría como la suma
    PAG r ( al menos 1 bola negra en la papelera ) = X = 1 norte ( B X ) ( norte X norte X ) ( norte norte ) .
    Y ya que tenemos k bins tendria que llevarlo a la potencia de k . Entonces, la probabilidad de que cada contenedor contenga al menos 1 bola negra sería:
    ( X = 1 norte ( B X ) ( norte X norte X ) ( norte norte ) ) k

Y una vez que se hace la división de esa manera, lo único que queda es: la probabilidad de que saque una bola negra de cada contenedor y esta no sé cómo definirla.

Entonces, en general, mi pensamiento es que la probabilidad de un evento mi se definiría como:

PAG r [ mi ] = número de combinaciones que elijo todos negros con la condición de que cada contenedor tenga al menos 1 negro número de todas las posibles divisiones y caminos que puedo elegir

Estaría muy agradecido si alguien me puede ayudar un poco ya que siento que estoy nadando alrededor de la solución pero no puedo llegar allí. ¿Mi consideración general es correcta, me estoy perdiendo algo? ¡Cualquier ayuda es bienvenida! ¡Muchas gracias de antemano!

Todavía no tengo una solución, pero su enfoque parece difícil. La probabilidad de sacar una bola negra de cada contenedor dependerá de la división exacta que tenga, por lo que no puede simplemente calcular la probabilidad de que tenga una división con al menos una bola negra en cada contenedor y luego calcular el siguiente paso . por separado.
Habiendo dicho eso, es fácil contar el número de divisiones 'válidas', es decir, aquellas con al menos una bola negra. la fórmula es ( B 1 k 1 ) ; ver aquí: en.wikipedia.org/wiki/…

Respuestas (1)

Comenzaré tratando de formalizar un poco su enfoque general y veré si va a alguna parte... Vamos B i denote el número de bolas negras en el i t h bin y considerar particiones PAG del norte bolas en el k bins, cada uno dado por B 1 = b 1 , , B k = b k con b i 0 y b 1 + b k = B . Por la ley de probabilidad total: Entonces

PAG ( todas las bolas escogidas son negras ) = b 1 + b k = B b i 1   i PAG ( todas las bolas escogidas son negras   |   B 1 = b 1 , , B k = b k ) × PAG ( B 1 = b 1 , , B k = b k )
Como usted señaló, no incluimos en la suma ninguna partición con b i = 0 para algunos i porque la probabilidad de recuperar todo dada una de esas particiones es automáticamente cero.

Para el primer término, comience con la observación de que

PAG ( todas las bolas escogidas son negras   |   PAG ) = PAG ( i = 1 k { se extrae la bola negra de   i t h   papelera   |   PAG } ) ) .
Y estos eventos en el lado derecho son independientes, entonces
PAG ( i = 1 k { se extrae la bola negra de   i t h   papelera   |   PAG } ) ) = i = 1 k b i norte .
Tres posibles interpretaciones:

  • Si tratamos de ir a lo seguro y etiquetamos los contenedores y las bolas negras, terminamos calculando

    PAG ( B 1 = b 1 , , B k = b k ) = Número de formas de colocar B objetos distintos en K contenedores con   b i   objetos en el   i t h   papelera Número de formas de colocar B objetos distintos en K contenedores = ( B b 1 , , b k ) k B .

  • Si etiquetamos contenedores pero no bolas, entonces estamos interesados ​​en tuplas ( b 1 , , b k ) de enteros no negativos que suman B en cuyo caso, cada partición posible es solo 1 multinomio de todos ellos, elegido (¿uniformemente supongo?) Al azar, es decir

    PAG ( B 1 = b 1 , , B k = b k ) = Número de   k   tuplas de exactamente la forma   ( b 1 , , b k ) Número de   k   tuplas de enteros no negativos que suman   B = 1 ( B + k 1 B ) = B ! ( k 1 ) ! ( B + k 1 ) ! .

  • Si ni las bolas ni los contenedores están etiquetados, se ingresa en particiones de B con como mucho k partes. No hay buenas fórmulas, demasiado difícil. Suponiendo que todo se haga de manera uniforme, no creo que importe lo que hagas. Usando la segunda de las tres interpretaciones anteriores, que parece natural, estás viendo:

    PAG ( todas las bolas escogidas son negras ) = b 1 + b k = B b i 1   i ( i = 1 k b i norte ) B ! ( k 1 ) ! ( B + k 1 ) ! .
    Pero no sé qué puedes hacer con esta expresión.

Usando la primera interpretación, obtienes una expresión potencialmente más complicada pero parece ser resumible al final; tienes:

PAG ( todas las bolas escogidas son negras ) = b 1 + b k = B b i 1   i ( i = 1 k b i norte ) ( B b 1 , , b k ) k B = 1 norte k k B b 1 + b k = B b i 1   i B ! ( b 1 1 ) ! ( b k 1 ) ! = B ! norte k k B ( B k ) ! b 1 + b k = B b i 1   i ( B k ) ! ( b 1 1 ) ! ( b k 1 ) ! = B ! norte k k B ( B k ) ! C 1 + C k = B k C i 0   i ( B k ) ! C 1 ! C k ! = B ! norte k k B ( B k ) ! k B k = B ! norte k k k ( B k ) ! .
Con B = W = k = 2 (en ese caso norte = 2 ), esta fórmula da:
2 ! 2 2 2 2 0 ! = 2 dieciséis = 1 8 ,
que es lo que también traté de explicar en los comentarios. Bien, parece que esto produce algún tipo de fórmula.

Para B = W = k = 2 esa expresión final es 1 3 ; si he entendido el problema correctamente, la enumeración real de las posibilidades lo hace 2 3 . Sin embargo, no pasé por la derivación.
Existe cierta ambigüedad en la pregunta de qué división "aleatoria" norte bolas en k bins significa, pero ahora que lo pienso, normalmente interpretaría esto como que los contenedores están etiquetados, por lo que las posibles particiones serían BB|WW, BW|BW, WW|BB. La partición BW|BW ocurre con probabilidad 1/2, las otras cada una con probabilidad 1/4. Para obtener todo negro al final, necesita BW|BW. Luego, también debe elegir la bola negra del contenedor 1 con una probabilidad de 1/2 y la bola negra del contenedor 2 con una probabilidad de 1/2. Entonces obtienes 1/8!?
Pensé que mi conteo del número de particiones contaría BB|WW y WW|BB como lo mismo ( 2 = 2 + 0 ) y luego decir que tiene la misma posibilidad de ocurrir como BW|BW (2 = 1 + 1). Entonces obtendrías la misma respuesta, pero aparentemente me estoy perdiendo algo más
@T_M ¡Muchas gracias por tu ayuda! De hecho, su enfoque es muy sencillo: pasé un tiempo pensando en ello, ¡y tiene mucho sentido! Tuve la única dificultad de entender cómo llegaste k B k de la última suma, ¡pero supongo que hay una buena fórmula que ayuda a hacerlo! También escribí un pequeño simulador de Python para estimar la probabilidad promedio y da prácticamente los mismos resultados que calcular la probabilidad directamente de su fórmula. ¡Una vez mas, Gracias!