Estoy tratando de generar correlaciones entre variables aleatorias (bidimensionales) con una relación lineal definida (en el sentido), pero con diferentes patrones visuales cuando se grafican. Estoy tratando de crear una tarea de 'adivinar la correlación' donde puedo manipular sistemáticamente la dificultad para que un observador adivine la relación lineal.
Lo que estoy haciendo ahora se le da una correlación Genero el primer y segundo valor, y , con muestras de la distribución normal estándar. Luego a partir de ahí hago una combinación lineal de los dos
Después:
Y ahora y tener una correlación .
Para manipular la dificultad he estado jugando con los parámetros de la distribución y Sin embargo, no estoy satisfecho con los resultados.
¿Alguna idea sobre cómo aumentar sistemáticamente la dificultad de la tarea? (es decir, agregar valores atípicos, por ejemplo, etc.).
Nota: La dificultad es una cuestión cognitiva/psicológica más que estadística. Tengo la intención de probar la noción de dificultad empíricamente (es decir, bajo combinaciones de parámetros específicos, las personas tienden a hacerlo peor). La idea es generar gráficos con parámetros variables para un valor de correlación dado (es decir, cambiar el número de puntos, la varianza, el valor atípico, la forma funcional, etc.). Cuáles son los parámetros y cuál sería una forma sistemática de manipularlos.
Probablemente necesitará hacer una prueba piloto para determinar la dificultad de una tarea correlacional dada.
A partir de la prueba piloto, necesitaría cuantificar la dificultad de la tarea. Una opción sería la discrepancia media entre la correlación real y la prevista. Sin embargo, habría otras métricas tanto de grado de error como de dificultad.
Supondría que las correlaciones más fáciles de adivinar basadas en diagramas de dispersión serían relaciones lineales sólidas que involucran distribuciones normales bivariadas y muchos datos (p. ej., n > 1000).
Hay un montón de cosas que podrías intentar para hacer la tarea más difícil. Esto es lo que me viene a la mente:
En términos más generales, creo que la práctica y los efectos de retroalimentación también serán relevantes. Es decir, puede ser relevante determinar si las diferencias de dificultad con los novatos también corresponden a diferencias relativas de dificultad con los participantes que han estado expuestos a la gama completa de elementos que ha generado.
Robin Kramer-diez tienen
Jeromy Anglim
entablillar
Robin Kramer-diez tienen