¿Es más fácil aprobar un examen con más preguntas y más errores permitidos, o menos preguntas pero menos errores permitidos?

q es un conjunto de preguntas de sí o no. sé la respuesta a q k norte o w de estas preguntas ( 0 q k norte o w | q | ) , pero tengo que adivinar para los restantes, con un 0.5 probabilidad de adivinar correctamente. Una prueba T se genera seleccionando aleatoriamente norte de estas preguntas
( | T | = norte ). Para pasar la prueba, puedo hacer k errores a lo sumo, con k > 0 .

  1. ¿Cuál es la probabilidad de pasar la prueba, en función de estos parámetros?
  2. Asumiendo norte / k es constante (por ejemplo, por cada diez preguntas en la prueba, se permite 1 error) ¿es mejor tomar la prueba con más o menos preguntas?

Esta pregunta surgió durante una discusión y pensé que la cantidad de preguntas no importa porque la probabilidad es siempre la misma, pero estoy empezando a pensar que podría ser más complicado que esto. ¿Debería ser un producto de distribuciones binomiales?

El patrón general será el siguiente: si el número que tienes que adivinar, q q k norte o w < 2 k , por lo que debe adivinar correctamente menos del 50% de las veces, cuantas más preguntas mejor, ya que debería estar más cerca de una fracción correcta de 0.5. Sin embargo, si necesita acertar más del 50%, entonces querrá menos preguntas, por lo que tiene una buena probabilidad de tener suerte.

Respuestas (2)

Considere lanzar una moneda justa 10 veces frente a 1000 veces. ¿Es más probable obtener 7 o más caras en el primer caso, o 700 o más caras en el segundo caso? Creo que puedes intuir que lo primero es más probable que lo segundo, y estarías en lo correcto. Esta es la Ley de los Grandes Números : cuanto mayor sea el tamaño de la muestra, más se puede esperar que la frecuencia observada se acerque a la probabilidad. Como tú mismo comenzaste a sospechar, de hecho todo se trata de la distribución: la curva de distribución se vuelve más estrecha cuanto mayor es el tamaño de la muestra. Por lo tanto, con una probabilidad de 0,5, puede esperar que la cantidad de caras con 1000 lanzamientos esté más cerca de 0,5 que si solo voltea 10 veces.

Por lo tanto: si la probabilidad de que adivine la respuesta correcta de una pregunta individual es mayor que el porcentaje de preguntas que necesita responder correctamente, entonces debe realizar la prueba con más preguntas. Si la probabilidad de adivinar correctamente es menor que el porcentaje necesario, entonces debe optar por la prueba más pequeña.

Como seleccionamos al azar norte pregunta de | q | preguntas sin reemplazo y q k norte o w de las preguntas tienen la "característica" de que sabe la respuesta, el número de preguntas de las que sabe la respuesta proviene de la distribución hipergeométrica . Si X denota la variable aleatoria correspondiente al número de preguntas de las que sabe la respuesta, la probabilidad de que sepa la respuesta exactamente metro preguntas es igual a:

PAG ( X = metro ) = ( q k norte o w metro ) ( | q | q k norte o w norte metro ) ( | q | norte )
Suponiendo que haya respondido correctamente a metro pregunta, el número de intentos correctos en las restantes norte metro preguntas siguen la distribución binomial con el parámetro pag = 1 2 . Dejar Y indican el número de preguntas adivinadas correctamente. Entonces
Y B ( norte X , 1 2 ) PAG ( Y = t ) = ( norte X t ) 2 X norte
Como Y depende de X , necesitamos sumar probabilidades condicionales para cada uno de los posibles valores de X , y sabemos que 0 X q k norte o w . Por lo tanto, la probabilidad de que responda correctamente exactamente norte k preguntas es igual:
PAG ( norte k ) = i = 0 q k norte o w PAG ( X = i ) PAG ( Y = norte k i | X = i ) = i = 0 q k norte o w ( q k norte o w i ) ( | q | q k norte o w norte i ) ( | q | norte ) ( norte i norte k i ) 2 i norte

Calculé lo anterior usando WolframAlpha y dio el resultado en términos de una función hipergeométrica .

PAG ( norte k ) = ( norte norte k ) ( | q | q k norte o w norte ) 2 norte ( | q | norte ) 2 F 1 ( k norte , q k norte o w ; norte q k norte o w + | q | + 1 ; 2 )

Esto, por supuesto, corresponde al escenario en el que se obtiene exactamente k errores. Para obtener la respuesta final, necesitamos calcular sobre todos los números viables de errores 0 j k . Entonces, la probabilidad de que pases el examen es igual a PAG pag a s s mi d :

PAG pag a s s mi d = ( | q | q k norte o w norte ) 2 norte ( | q | norte ) j = 0 k ( norte norte j ) 2 F 1 ( j norte , q k norte o w ; norte q k norte o w + | q | + 1 ; 2 )

Sin embargo, no me veo capaz de calcular lo que sucede, cuando k norte es constante