Procedimientos para establecer la escala de CI

Hay algunas buenas respuestas sobre la evaluación de la inteligencia del individuo y sobre el lado matemático de la escala de coeficiente intelectual, por ejemplo :

Cuando se desarrollan las pruebas de CI actuales, la puntuación bruta mediana de la muestra normativa se define como CI 100 y las puntuaciones de cada desviación estándar (DE) hacia arriba o hacia abajo se definen como 15 puntos de CI más o menos,[2] aunque esto no siempre fue así históricamente. Según esta definición, aproximadamente dos tercios de la población obtienen puntajes entre CI 85 y CI 115, y alrededor del 5 por ciento de la población obtienen puntajes superiores a 125.[3][4]

Sin embargo, lo que quería preguntar es el aspecto organizativo/"político" del establecimiento de los parámetros de la prueba, el procedimiento de "calibración".

  • ¿Quién (organización/persona/entidad) establece o actualiza los coeficientes que hacen que el puntaje promedio de la prueba para una edad determinada corresponda a un coeficiente intelectual de 100 y los incrementos de desviación estándar de 15?

  • ¿Quién es el grupo de prueba? ¿Cómo proporciona la población analizada los datos sin procesar para establecer la selección anterior? (en particular, cómo evitar el sesgo de selección: las personas que desean realizar pruebas de coeficiente intelectual, porque esperan (con razón) obtener un buen resultado y, por lo tanto, alardear de tener un coeficiente intelectual alto; las personas con un coeficiente intelectual bajo evitan el esfuerzo esperado, la frustración y la vergüenza).

  • ¿Cómo se ve eso en el panorama internacional? ¿Los coeficientes son establecidos "por nación" y calculados por organizaciones nacionales, o son globales, o alguna otra forma todavía?

Respuestas (3)

Debido a que no puedo dar un comentario, publicaré una respuesta, eso no es suficiente. Sin embargo, espero que esto pueda darle un poco más de información. Además, mi conocimiento se basa principalmente en las pruebas de inteligencia alemanas.

1.) Por lo general, esto lo hace la institución/persona, etc., que ha desarrollado la prueba de coeficiente intelectual. Sin embargo, en algunos casos los parámetros no se actualizan. Por lo tanto, siempre debe verificar esto. Especialmente con respecto a las pruebas de coeficiente intelectual muy antiguas y el efecto Flynn.

2.) En primer lugar, el tipo de prueba-muestra generalmente depende de la población para la cual se está desarrollando la prueba de coeficiente intelectual (si desea una prueba de coeficiente intelectual para personas inteligentes en sus 20, debe ir y probarlo en diferentes universidades ). En el caso de Alemania: muchas pruebas de coeficiente intelectual suelen tomar muestras en diferentes partes de Alemania, con diferentes atributos demográficos. Por lo general, a las personas se les paga por participar. Aún así, en la mayoría de los casos es difícil muestrear una muestra representativa, debido a que las personas con mayor estatus social e inteligencia tienden a aceptar más fácilmente participar (“lamentablemente”, no se puede obligar a alguien a participar). Entonces, los aspectos que ha mencionado son de hecho un gran problema, con el que generalmente no se puede tratar a la perfección. A veces se les dice a las personas que no recibirán retroalimentación sobre su desempeño o solo si así lo desean. Como puedes suponer, esto apenas contrarresta el problema. Además, las muestras representativas enormes son costosas de recolectar. Por lo tanto, la triste verdad es que en la mayoría de los casos se trata de aproximaciones representativas (al menos en Alemania). Estas son las razones por las que muchas pruebas de coeficiente intelectual (alemanas) están sesgadas hacia arriba (por ejemplo, en elIST-2000R se han graduado de la escuela secundaria (="Abitur") más personas que el promedio; esto es aún peor para la versión extendida: para contrarrestar eso, las submuestras se ponderan de manera diferente). Solo una pequeña nota: las pruebas de coeficiente intelectual para estudiantes suelen estar mejor normalizadas, debido al hecho de que se puede acceder a ellas más fácilmente. En pocas palabras: los investigadores a menudo intentan hacer frente al sesgo de selección, pero a menudo no pueden evitarlo.

3.) para ser honesto: no tengo conocimiento sobre el panorama internacional

Solo como una pequeña nota: normalmente encontrará información más detallada en el manual específico de IQ. Y: cuando utilice una prueba de CI, siempre debe pensar en si su participante de la prueba se puede comparar o no con la muestra de la prueba (no debería tener ningún problema al comparar el rendimiento de CI de un participante de 35 años cuando el muestra de prueba es representativa para edades entre 20 y 30, debido al hecho de que la disminución en la inteligencia promedio (fluida) de 20 a 35 no es tan grande (en comparación con el aumento en la edad más joven, ver fe Baltes ( 1997) Figura 3). Pero, por supuesto, solo puedes hacer juicios relativos a la muestra de prueba (no representativa), no a toda la población en sí. Esta es también la razón por la que no me gustan afirmaciones como "mi El coeficiente intelectual es...",

Un artículo que trata (junto con otros aspectos del desarrollo humano) del desarrollo de la inteligencia fluida y cristalizada a lo largo de la vida: Baltes, PB (1997). Sobre la arquitectura incompleta de la ontogenia humana: selección, optimización y compensación como fundamento de la teoría del desarrollo. Psicólogo estadounidense , 52(4), 366-380.

¿La información sobre el sesgo al alza en los resultados de IST-2000R también proviene del artículo de Baltes? ¿O debería citarse algo más para eso?
No, no es. Desafortunadamente, la información proviene de diapositivas de una conferencia a la que asistí una vez. Tú/yo puedo borrar esa parte, si quieres.
está bien que guarde la información, pero no estaba seguro de la fuente.

Participé en la normalización de la versión alemana del WAIS-IV en 2012. El procedimiento para normalizar una prueba psicológica es siempre el mismo:

  1. Se extrae una muestra representativa de toda la población.

    Lo que difiere entre las pruebas es cómo se extrae la muestra. Para el WAIS-IV, se reclutó el mismo número de personas para cada grupo de edad (creo que en incrementos de 5 años), género y nivel educativo en cuatro regiones de Alemania. Así que, si bien, como ha explicado @bucky, ciertos grupos de personas están más dispuestos a participar, hemos llenado cada "cubo" de la muestra con la misma cantidad de personas. El esfuerzo por llenar ciertos baldes fue mayor, pero ninguna subpoblación está sobrerrepresentada.

    Otras pruebas usan diferentes procedimientos para extraer sus muestras, y este es uno de los criterios distintivos entre diferentes pruebas, y la razón por la cual algunas pruebas (como las pruebas de Wechsler) son preferidas sobre otras.

  2. La normalización generalmente la hace el propio autor de la prueba cuando la prueba se publica por primera vez. Las revisiones posteriores a menudo son normalizadas por el editor de la prueba con la ayuda de "evaluadores profesionales".

    En el caso del WAIS-IV, la muestra fue probada por estudiantes de psicología de cuatro universidades alemanas que habían sido instruidos en la aplicación de la prueba. La prueba fue supervisada por estudiantes graduados especialmente educados. Las normas fueron calculadas a partir de los resultados de las pruebas de muestra por un estadístico experimentado. Todo el procedimiento fue supervisado por psicólogos que trabajaban en el editor de la prueba (Pearson).

    A veces, los individuos (p. ej., académicos) u organizaciones (p. ej., universidades) crean normas para una población independiente del autor o editor de la prueba y, a veces, estas normas se publican (como artículos científicos) para que las utilicen otros académicos.

    A veces, las normas para subpoblaciones que no han sido muestreadas durante la normalización oficial se extrapolan matemáticamente, por ejemplo, si las personas mayores de cierta edad no han sido parte de la muestra normalizada, la curva de la distribución de edad por resultado se amplía matemáticamente para incluir las edades que faltan. .

  3. Las normas siempre son aplicables solo a la población de la que se extrajo la muestra. Es por eso que la población siempre se menciona junto con las normas.

    Las pruebas grandes (en el sentido de popularidad y esfuerzo de publicación) como las pruebas de Wechsler están normalizadas para cada país, a veces incluso para diferentes subpoblaciones dentro de un país (por ejemplo, por género, por edad, para diferentes grupos ocupacionales, para diferentes situaciones de prueba [por ejemplo, hay normas de 10 y 20 minutos para las Matrices Progresivas de Raven, dependiendo de cuánto tiempo desee dar a sus probandos para responder], y así sucesivamente).

    Si no existen normas para una población que le gustaría probar (como usuario de la prueba), un psicólogo experimentado podría estimar los resultados de la prueba a partir de normas de otra población cuando se conoce la relación entre las dos poblaciones con respecto al constructo probado.

    (Hay un intenso debate en curso sobre este procedimiento. Usando la inteligencia como ejemplo, cuando usa diferentes normas para diferentes poblaciones, todas las poblaciones serán igualmente inteligentes. Normar significa que la persona promedio en esa población se define como que tieneun coeficiente intelectual de 100. ¡Su puntuación bruta puede diferir! Entonces, cuando usa, por ejemplo, una norma africana para los africanos y una norma europea para los europeos, los africanos y los europeos parecen ser igualmente inteligentes. Pero cuando usas la misma norma para ambas poblaciones, la población africana parece tener un coeficiente intelectual más bajo. Hay muchas interpretaciones diferentes de este resultado: que los africanos son menos inteligentes, que las pruebas tienen un sesgo cultural, que la "inteligencia", tal como se prueba con una prueba de coeficiente intelectual, depende de la educación, que la inteligencia difiere entre culturas, etc. Lo que es seguro es que la normalización, incluso si se pudiera hacer perfectamente, no le dice qué significan los resultados de la prueba).

Nunca trabajé en el desarrollo de pruebas de inteligencia, pero por lo que he leído y escuchado de mis profesores, podría expresarse en palabras cortas considerando la comparación internacional de los resultados: Para cada prueba que vaya a realizar, primero debe alinear en alguna teoría de la inteligencia, según la cual vas a hacer las preguntas. Tnen, le das un montón de estas preguntas a la muestra. De acuerdo a sus respuestas, eliges las preguntas de acuerdo a su dificultad, algunas son tan fáciles que casi todos podrán resolverlas, algunas deben ser de dificultad media y otras muy difíciles. Entonces, debe calcular cuántas de estas preguntas deben ser para permitir que los resultados de alguna población tomen la forma de la curva normal. Entonces usted hace que la media aritmética de esta curva esté marcada con IQ 100 y una desviación estándar de 15 puntos IQ. Así se calcula. Por supuesto, debe asignar a la media aritmética un valor de 200, pero podría ser un poco complicado para el cálculo. Por lo tanto, si toma las muestras para cada prueba de un estado, como suele hacerse, los resultados no podrán compararse entre los miembros de diferentes estados. Sin embargo, si pudiera tomar la muestra de varios estados, los resultados deberían compararse entre estos estados. Hay un problema considerando el estado que se conoce como influencia cultural. La cuestión de si los artículos podrían elegirse de manera que la cultura en la que vive la gente no influya en cómo. De lo que puedes pensar en otra posible generalización de este problema,

Puede leer más sobre la prueba en los libros de Spearmans, que están disponibles en Internet. Los recomendaría por varias razones, además de que me gustan y los encuentro muy fáciles de leer. Una de ellas es que es uno de los primeros que desarrolló teorías de la inteligencia tras las cuales se realizan las primeras pruebas. También he encontrado, creo que en uno de sus libros, pero no estoy del todo seguro, la referencia al papel Galton cuando introdujo la curva normal. Desafortunadamente, aún no lo he encontrado, así que si usted u otra persona encuentra este documento, me gustaría pedirle que me lo envíe si es posible. Y ese documento le daría la respuesta completa a su pregunta (considerando la curva de Bell)