es un conjunto de preguntas de sí o no. sé la respuesta a
de estas preguntas (
, pero tengo que adivinar para los restantes, con un
probabilidad de adivinar correctamente. Una prueba
se genera seleccionando aleatoriamente
de estas preguntas
(
). Para pasar la prueba, puedo hacer
errores a lo sumo, con
.
Esta pregunta surgió durante una discusión y pensé que la cantidad de preguntas no importa porque la probabilidad es siempre la misma, pero estoy empezando a pensar que podría ser más complicado que esto. ¿Debería ser un producto de distribuciones binomiales?
Considere lanzar una moneda justa 10 veces frente a 1000 veces. ¿Es más probable obtener 7 o más caras en el primer caso, o 700 o más caras en el segundo caso? Creo que puedes intuir que lo primero es más probable que lo segundo, y estarías en lo correcto. Esta es la Ley de los Grandes Números : cuanto mayor sea el tamaño de la muestra, más se puede esperar que la frecuencia observada se acerque a la probabilidad. Como tú mismo comenzaste a sospechar, de hecho todo se trata de la distribución: la curva de distribución se vuelve más estrecha cuanto mayor es el tamaño de la muestra. Por lo tanto, con una probabilidad de 0,5, puede esperar que la cantidad de caras con 1000 lanzamientos esté más cerca de 0,5 que si solo voltea 10 veces.
Por lo tanto: si la probabilidad de que adivine la respuesta correcta de una pregunta individual es mayor que el porcentaje de preguntas que necesita responder correctamente, entonces debe realizar la prueba con más preguntas. Si la probabilidad de adivinar correctamente es menor que el porcentaje necesario, entonces debe optar por la prueba más pequeña.
Como seleccionamos al azar pregunta de preguntas sin reemplazo y de las preguntas tienen la "característica" de que sabe la respuesta, el número de preguntas de las que sabe la respuesta proviene de la distribución hipergeométrica . Si denota la variable aleatoria correspondiente al número de preguntas de las que sabe la respuesta, la probabilidad de que sepa la respuesta exactamente preguntas es igual a:
Calculé lo anterior usando WolframAlpha y dio el resultado en términos de una función hipergeométrica .
Esto, por supuesto, corresponde al escenario en el que se obtiene exactamente errores. Para obtener la respuesta final, necesitamos calcular sobre todos los números viables de errores . Entonces, la probabilidad de que pases el examen es igual a :
Sin embargo, no me veo capaz de calcular lo que sucede, cuando es constante
Pablo