Elección de la prueba estadística adecuada para datos ordinales

Las variables de respuesta ordinal aparecen a menudo en biología, pero no estoy seguro de cómo se analizan mejor. Algunos ejemplos son evaluaciones cualitativas (poco, mucho, mucho) o evaluaciones de riesgo (riesgo bajo, riesgo medio, riesgo alto).

Mi estudio trata sobre la correlación entre el dolor y los niveles de depresión. Estamos midiendo el dolor en una escala Likert ordinal . Esta es una escala numérica que va del 10 (dolor intenso) al 0 (sin dolor).

También mediremos la depresión en una escala similar (escala: 4 - 0).

¿Qué prueba estadística debo utilizar?

Esto quizás se adapte mejor a las matemáticas SE.
@canadianer Esto no es adecuado para Math.SE, pero tiene validación cruzada ( stats.stackexchange.com )
Creo que esto es adecuado, ya que las escalas de Likert se (ab)utilizan a menudo en la investigación biomédica.
@ChrisStronks la pregunta no es sobre biología sino sobre la aplicación de un método estadístico. Su respuesta es excelente y sería una gran adición a Cross Validated, pero creo que está fuera de tema aquí.
@Luigi No es de extrañar que no haya podido encontrar un SE de estadísticas...
Prueba U de Mann-Whitney. (?)
Creo que podría ser útil tener esta pregunta en el sitio, ya que este problema puede surgir en muchos campos biológicos. Está claramente dentro del tema en stats.stackexchange.com también, pero esto no significa necesariamente que esté fuera de tema aquí. La elección de métodos/supuestos también puede interactuar con el proceso biológico que está tratando de modelar, por lo que creo que también es el tema aquí. Si preguntas como esta están cerradas, creo que debemos cerrar muchas de las otras preguntas usando la etiqueta de estadísticas para ser justos.
Le vendría bien información sobre el diseño experimental, si se trata de un diseño equilibrado, tamaños de muestra y normalidad de las distribuciones e hipótesis.

Respuestas (2)

Puede usar la regresión multinomial ordinal (también conocida como logit ordenado) si la respuesta es ordenada. Estos métodos son básicamente extensiones de regresiones logísticas, pero usan, por ejemplo, un logit acumulativo en lugar del logit. Sin embargo, hay una serie de suposiciones diferentes que debe tener en cuenta. Por ejemplo, ¿usará una suposición de probabilidades proporcionales (que se usa comúnmente), lo que significa que hay una probabilidad igual de pasar, por ejemplo, de clase 1 -> 2 y clase 5 -> 6? También puede evaluar la suposición de probabilidades proporcionales utilizando gráficos o una prueba de puntuación. Si no se puede ordenar la respuesta, existen métodos nominales multinomialesque puede usar, y también puede evaluar los resultados de un análisis ordenado comparando las predicciones con las de un análisis nominal multinomial. He utilizado este tipo de métodos para el análisis de las clasificaciones de la lista roja, que están claramente ordenadas pero no pueden transformarse simplemente en una respuesta numérica (similar a su situación).

El libro Analysis of Ordinal Categorical Data (Agresti. 2010) es un muy buen punto de partida.

En R, puede consultar los paquetes polry vgambuscar formas de realizar diferentes tipos de análisis en datos ordinales. El autor del libro anterior también ha publicado algunos ejemplos para el análisis de datos categóricos en R, usando los paquetes que mencioné: Ejemplos de uso de R para modelar datos ordinales . En SAS se pueden realizar análisis similares utilizando Proc Genmody Proc Logistic.

La prueba de una escala ordinal requiere pruebas estadísticas no paramétricas. La media y la desviación estándar son parámetros no válidos para las estadísticas descriptivas siempre que los datos estén en escalas ordinales, al igual que cualquier análisis paramétrico basado en la distribución normal.

El informe de Allen & Seaman, 2007 describe una serie de posibles pruebas:

Los procedimientos no paramétricos, basados ​​en el rango, la mediana o el rango, son apropiados para analizar estos datos, al igual que las estadísticas de chi-cuadrado.

En particular, los modelos de Kruskall-Wallis se pueden usar para reemplazar un análisis de varianza paramétrico estándar, ya que se basa en los rangos y no en las medias de las respuestas. Dado que estas escalas son representativas de una medida continua subyacente, una recomendación es analizarlas como datos de intervalo como piloto antes de recopilar la medida continua.

Sin embargo, las pruebas no paramétricas tienen un poder estadístico notoriamente bajo. Hay una manera de hacer una escala Likert ordinal como las que usas continua usando una regla o un control deslizante, mira la siguiente figura (tomada de Allen & Seaman, 2007 ):

control deslizante

Este truco lo hace continuo y se pueden usar pruebas paramétricas normales, lo que aumenta sustancialmente el poder estadístico. Sin embargo, es mucho más trabajo analizar los datos. Especialmente cuando los sujetos indican su dolor/depresión percibido poniendo físicamente una marca en una regla de papel, ya que tienes que medir manualmente las respuestas. Un control deslizante digital puede hacer su vida más fácil. Si tienes pensado hacer cientos de asignaturas, debes pensar detenidamente en las posibles opciones.

¡Buena suerte!

Existen pruebas paramétricas para variables de respuesta ordinal, que son básicamente extensiones de regresiones logísticas.