Riqueza de especies corregida por área: ¿debería transformarse el área logarítmicamente?

Estoy haciendo un estudio para comparar la riqueza de especies de plantas (número total de especies por sitio) con una serie de factores ambientales de los sitios en los que se estudiaron estas plantas. Debido a que estos sitios son de diferentes tamaños, he convertido la riqueza de especies en una medida de densidad de especies dividiéndola por el logaritmo del área del sitio (densidad de especies = riqueza de especies/log[área]).

Transformé el área logarítmicamente porque la relación entre la riqueza de especies y el área en mis sitios es lineal en una escala semilogarítmica. Ahora que he calculado la densidad de especies de esta manera, me está costando convencerme de que calcular la densidad con log(área) era el enfoque correcto. ¿Alguien tiene alguna idea sobre esto? Mi experiencia en ecología comunitaria no es sólida y me estoy atascando en la literatura.

¡Gracias!

Respuestas (1)

Permítanme ofrecer mi respuesta a pesar de que no he trabajado en ecología.

Me haces dos preguntas si te entiendo bien:

  1. ¿Debería normalizar al área muestreada?

La respuesta a eso depende de si el área muestreada es una variable molesta o no. ¿Es el caso de que acaba de tomar muestras de áreas con tamaños (en gran parte) diferentes? ¿O más bien espera o le interesa si puede mostrar alguna interacción con los factores ambientales que estudia? En el primer caso, normalizar con la conciencia tranquila. En este último, probablemente debería incluir el área muestreada en su modelo. La razón de esto es que al normalizar se está asumiendo que la relación entre la variable respuesta (número de especies) y el predictor (área muestreada) es fija y tiene una pendiente de 1 independientemente de la variación del resto de variables incluidas en tu modelo Si ese no es el caso, desea agregar explícitamente el área muestreada como un factor fijo en su modelo.

  1. ¿Debería transformar logarítmicamente el área muestreada?

Si la respuesta a la primera pregunta es que el área muestreada es una variable molesta, entonces no importa si realiza una transformación logarítmica o no, ya que ahora está interesado en una nueva medida, la densidad de especies. Por lo tanto, puede trabajar con la variable no transformada, lo que simplificaría un poco la interpretación de los resultados. Si la respuesta a la primera pregunta es que desea investigar la interacción de la variable 'área muestreada' con sus otras variables predictoras, entonces no necesita transformar logarítmicamente su variable ya que esto rara vez es necesario, incluso si usa paramétrico inferencia. Para resumir, no necesita transformar la variable 'área muestreada'.

Si la relación entre la riqueza de especies y el área es lineal en una escala semilogarítmica (como dice la pregunta), ¿no sería mejor incluir log[área] en su modelo?
Suponiendo que utilizará un modelo con una suposición de linealidad, no necesita transformar la variable predictora. Es solo cuestión de gustos para la interpretación de los resultados . La variable más común para transformar es la variable de respuesta, si es necesario. Pero supongo que esto sigue una distribución discreta como poisson. Por lo tanto, no realizaría una regresión lineal sino una regresión de Poisson. Necesitaríamos más detalles sobre el análisis para decir más.
Si elige estudiar la densidad de especies, que seguirá una distribución logarítmica normal según tengo entendido, entonces probablemente necesitará transformar la variable de respuesta de densidad de especies o usar un GLM con un enlace de registro.
Creo que esto último será el caso. Sin embargo, estoy empezando a preguntarme si esta pregunta no debería migrarse a stats.exchange...
El factor importante de la cuestión de si normalizar o no es una cuestión biológica (ver mi punto 1). Con respecto a la transformación de registro de una variable predictora, encontrará muchas publicaciones (potencialmente duplicadas) en stats.exchage, incluida la que vinculé.