Encontrar subconjuntos que se cruzan para un coeficiente binomial dado

Mis disculpas si esta pregunta es más apropiada para mathisfun.com, pero solo puedo llegar hasta cierto punto leyendo sobre combinatría y teoría de conjuntos antes de que la lógica entrelazada se vuelva totalmente borrosa. Si este es un concepto totalmente fundamental, no dude en nombrarlo para que yo mismo pueda leer y entender las matemáticas.

Entonces, el objetivo es minimizar la repetición de preguntas en un cuestionario para evitar (o realmente ralentizar) la creación de una clave maestra. Esto es para un cliente y le expliqué que para que esto sea realmente realista, la cantidad de preguntas en el grupo maestro debería ser enorme, pero quiero mostrarles las matemáticas detrás de su idea.

Por lo tanto, sugirieron tener un grupo de 20 preguntas con un conjunto dado que sea un subconjunto de 5 miembros. Descubrí que el número total de cuestionarios únicos ( 20 5 ) sería 20 ! 5 ! ( 20 5 ) ! o 15504 cuestionarios únicos. Pero sé que la mayoría de esos cuestionarios serán casi idénticos y que los tramposos no tardarán tanto en ver las 20 preguntas para hacer la clave. Para probarme esto a mí mismo (sin saber las matemáticas), simplifiqué las combinaciones totales a ( 4 3 ) , al igual que:

{a,b,c,d} = {{a,b,c}; {a, b, d}; {b, c, d}; {a, c, d} }

Y veo que solo se necesita ver 2 cuestionarios para ver los 4 miembros del conjunto maestro. Entonces, sabiendo que la cantidad de combinaciones (¡coeficiente binomial!) no es equivalente a la cantidad de apariciones únicas del conjunto maestro, me gustaría saber las matemáticas reales involucradas para mostrarle al cliente que si bien tiene un montón de cuestionarios, es solo toma X para conocer a todos los miembros.

Gracias como siempre.

Apéndice

Un poco más de investigación me ha presentado el problema NP-completo conocido como Exact Cover, que sería (si lo estoy leyendo bien) un conjunto preciso de subconjuntos que tienen una unión igual al conjunto maestro original. Solo quiero aclarar que esta restricción de superposición perfecta no es necesaria para mi pregunta, solo el número mínimo de subconjuntos que daría como resultado una unión que tiene todos los miembros del conjunto maestro, independientemente de la repetición, para demostrar cuántos subconjuntos son necesitaba conocer el conjunto original (suponiendo que el buscador del conjunto maestro conoce el recuento total de miembros). Modifiqué mi micro-experimento de ( 4 3 ) a ( 4 2 ) lo que da como resultado 6 combinaciones y la capacidad de derivar el conjunto maestro ya no es posible con un número específico de subconjuntos arbitrarios. En cambio, obtengo:

{a, b, c, d} = {{ab}; {ca}; {anuncio} ; {antes de Cristo} ; {b}; {cd} }

que podría derivar el conjunto maestro usando los primeros tres ( a ) grupos, o la cobertura exacta de a , b ; C , d . Esto me hace pensar que los subconjuntos mínimos necesarios para derivar el conjunto original es igual a la cantidad de subconjuntos en los que aparece cualquier miembro dado (entonces, en este caso, 3 a s, pero esto no coincide con el ( 4 3 ) , donde se puede encontrar con 2 subconjuntos. La siguiente solución obvia (para mí) es que el número mínimo necesario para derivar el conjunto maestro (a ciegas) es la mitad del número total de subconjuntos, pero realmente me gustaría un enlace a una prueba o una demostración en inglés simple sobre cómo un grupo de 20 preguntas requeriría 7752 subconjuntos para saber con certeza que los 20 miembros han aparecido al menos una vez.

Gracias otra véz.

Pregunta como probabilidad:

Tengo una bolsa de fichas de Scrabble y sé lo siguiente:

  1. La bolsa contiene 20 fichas,
  2. Cada ficha es única (no hay dos fichas con el mismo carácter),
  3. Los mosaicos provienen de un conjunto mucho más grande (y por lo demás irrelevante) de un conjunto de expansión que incluye números y caracteres del alfabeto no romano, lo que elimina cualquier ventaja de saber que este conjunto de 20 proviene de un conjunto más grande pero limitado (en otras palabras , los personajes son solo informativos entre sí y es posible que obtenga todo el klingon o una mezcla de chino y tamil. No debo asumir nada sobre el conjunto que no sea lo que está en la bolsa).

Se me permite realizar los siguientes pasos en el orden indicado tantas veces como quiera:

  1. Saca 5 fichas,
  2. Anota los caracteres dibujados,
  3. Devuelve las fichas a la bolsa.
  4. Hacer espuma, enjuagar, repetir.

Además: tengo dedos mágicos que me impiden dibujar el mismo conjunto de 5 dos veces, reduciendo así el número de sorteos de infinito a 15504 sorteos posibles.

Mi objetivo es tener los 20 caracteres escritos eventualmente y luego dejar de dibujar caracteres.

Sé que el número total de combinaciones únicas que podría dibujar es ( 20 5 ) que es 15504. También sé que los sorteos mínimos requeridos son iguales a 20 / 5 , que sería muy afortunado. Lo que me interesa es el número máximo de sorteos necesarios para revelar los 20 personajes.

No creo que esta sea la pregunta correcta para el problema real de la vida real: evitar la repetición para una persona en particular ayudará a las personas a crear rápidamente una lista completa de preguntas.

Respuestas (2)

Con 20 preguntas en total; y 5 por cuestionario, y con el único objetivo de repetir lo más tarde posible (ya que entiendo su pregunta), debe comenzar a repetir en el quinto cuestionario. Si los numeras arbitrariamente, tienes 1 5 en prueba 1 , y dieciséis 20 en prueba 4 (si su único objetivo es minimizar/prolongar el tiempo de repetición). Por el mismo objetivo, prueba 5 repetirá 1 5 , etc. Esto probablemente no sea lo que implementaría, ya que podría predecir las preguntas precisas precisamente para un próximo cuestionario (después de un tiempo); pero, según entiendo tu pregunta, qué harías. No es realmente una pregunta de coeficiente binomial (no entendí su separación del grupo que conduce a ( 4 3 ) ). Para usar algo más de manera significativa, debe imponer más condiciones.

Veo que estás diciendo (creo) que el sujeto podría derivar el conjunto maestro con un mínimo de 4 subconjuntos si dibuja los 4 subconjuntos que no se cruzan, lo que en mi problema sería increíblemente afortunado. Ese sería el verdadero mínimo necesario, al igual que tener todos los 15504 sería el verdadero máximo, ya que tener todos los subconjuntos eliminaría cualquier duda. Lo que espero que exista es una fórmula para determinar la cantidad mínima de subconjuntos que el culpable necesita obtener a ciegas para garantizar que todos los miembros del conjunto maestro estén presentes, conociendo solo el tamaño del grupo y el tamaño de la muestra.
Veo. ¿Así que sacas 5 pruebas al azar, cada vez? Entonces solo puede calcular probabilidades (asumiendo, digamos, 5 por sorteo, la misma probabilidad de sacar cualquiera en cada sorteo); y nunca podría garantizar que todos hayan sido dibujados (simplemente se vuelve cada vez más improbable). es la configuracion?
¿Es esta la configuración, quise decir.
...pero también tengo cada vez más la sensación de que estás haciendo una pregunta interesante que simplemente no entiendo. :)
@Anthony: el "número mínimo de subconjuntos que el culpable necesita obtener a ciegas para garantizar que todos los miembros del conjunto maestro estén presentes" es norte / k , dónde norte es el tamaño de la piscina y k es el tamaño de la muestra. Tal vez en realidad esté buscando la cantidad esperada de cuestionarios necesarios para haber visto todo el grupo. Eso lo convertiría en una pregunta de probabilidad, por lo que si eso es lo que desea, debe etiquetarlo como tal.
@gnometorule: espero que sea interesante, como sugiere la falta de una respuesta fácil a través de Google. Por lo menos espero que no sea NP. La configuración es que a un examinado se le da una prueba con 5 preguntas y esas 5 preguntas provienen de un grupo de 20 preguntas. El objetivo del examinado es tomar el examen suficientes veces para saber las 20 preguntas (suponiendo que el tramposo ya conoce el tamaño del grupo). Si el número supera el número total de examinados, entonces sabemos que es razonable suponer que todos los examinados tendrán al menos una pregunta que no esté en una hoja de trucos compilada.
@Snowball: tal vez lo que quiero decir es "la cantidad máxima de subconjuntos necesarios para garantizar que todos los miembros estén presentes, pero también evitar la solución más rápida a corto plazo de simplemente robar todos los subconjuntos". No estoy seguro de cómo expresar la idea de "el mínimo máximo" para indicar que quiero reducirlo al número que asegure una unión completa sin ver el contenido de los subconjuntos en el momento de obtenerlos.
La forma en que leo esto, esto todavía no se puede hacer. Aquí hay una analogía: suponga que lanza una moneda repetidamente. Traduciría su pregunta a este caso "¿Cuándo habré visto H y T con seguridad?" Pero la probabilidad de no ver nunca H no es cero: aunque es increíblemente improbable, podrías seguir arrojando T (asintóticamente, esta probabilidad tiende a cero; pero no es un numero
Una posible pregunta probabilística sería: "¿Cuál es la probabilidad PAG norte haber visto todos los personajes paso a paso norte ? ¿Hay alguna fórmula de forma cerrada que sea más bonita que simplemente resumir todos los casos?" Si esto le interesa, tal vez vuelva a publicar la última versión de su pregunta como una nueva pregunta, ya que es lo suficientemente diferente, pero probablemente solo la haya notado.
Volviendo a su pregunta original, creo que lo que estaba preguntando es sobre esto: describa su configuración. El objetivo es "hacer que sea difícil deducir tu conjunto maestro". ¿Hay alguna manera de enmarcar este problema en un marco teórico de la información? ¿Cómo? En tal marco, ¿cómo compara la "seguridad" de diferentes asentamientos (por ejemplo, 40/10 frente a 20/5, etc.)? ¿Existe sólo el cálculo probabilístico de verosimilitudes? Siéntase libre de hacer cambios menores a la configuración básica,
Liquidar = configuraciones (error tipográfico). Entonces, si te entendí bien (te preguntas sobre la configuración de la última pregunta), también podrías publicar esa (no estoy seguro de los estatutos aquí, pero me parece lo suficientemente diferente como para justificar una nueva publicación).
@gnometorule - actualizado para eliminar infinito.
Creo que está viendo algo que no está a un millón de millas del "problema del coleccionista de cupones" y encontrará mucha literatura si busca esa frase clave.

Parece estar preguntando sobre el número máximo de combinaciones distintas de 5 elementos elegidos entre 20 tal que la unión de todas esas combinaciones no llene todos los 20 elemento. (Luego seleccionando uno más distinto 5 -combinación uno es seguro para cubrir todos 20 elementos.)

Parece clara la mejor estrategia para evitar cubrir todos 20 elementos es elegir (secretamente) un elemento entre los 20 que nunca seleccionarás, hasta que te obligue el requisito de no reproducir nunca una selección anterior. esto te deja 19 elementos, de los cuales puedes presentar todos ( 19 5 ) = 11628 combinaciones en un orden aleatorio. Después de eso, su combinación 11629-ésima se ve obligada a usar el elemento final que tanto deseaba mantener en secreto.