¿Cómo se debe calcular la densidad de especies para una distribución agrupada?

Imaginemos que se muestrean 5 parcelas de diferentes tamaños para una especie objetivo:

plot#  count  area(m^2)  plot_density
  1      1       5         0.2
  2      3       2         1.5
  3      0      10         0.0
  4      5       1         5.0
  5      2       6         0.33

¿Cuál es la densidad de esta especie? Veo dos formas de calcular la densidad que dan valores completamente diferentes.

La primera forma promedia la densidad en cada parcela:

Σ ( C o tu norte t i a r mi a i ) 5 = 1.41 / metro 2

Esto parece estar bien , pero no hace mucho para controlar los cambios en el tamaño de las parcelas. Por ejemplo, si la parcela 3 anterior fuera 10 veces más grande, la densidad seguiría siendo la misma. En una situación en la que el tamaño de las parcelas está determinado por el entorno (por ejemplo, bajo objetos de cobertura natural), esto parece menos que ideal.

La segunda forma suma los conteos y el área de búsqueda y los divide:

Σ ( C o tu norte t i ) Σ ( a r mi a i ) = 0.46 / metro 2

Prefiero el segundo método porque parece describir la densidad de los animales con mayor precisión. Y me encantaría usar el segundo método, pero mi problema es que no estoy seguro de cómo calcular una estadística de resumen para el método dos, ya que nunca se calculó la media. El método uno da una desviación estándar de 2.1. ¿Cuál es la desviación estándar para el método dos?

Una posible solución que se me ocurrió consiste en dividir las parcelas más grandes en parcelas de 1 m ^ 2 y dividir la cantidad de animales en esas parcelas más pequeñas. Así que ahora tengo 24 parcelas de 1 m ^ 2 con los siguientes "recuentos":

plot#  count  area(m^2)  plot_density
1-5      0.2       1         0.2
6-7      1.5       1         1.5
8-17     0.0       1         0.0
18       5.0       1         5.0
19-24    0.33      1         0.33 

Ahora, usando la primera ecuación anterior obtengo:

Σ ( C o tu norte t i a r mi a i ) 24 = 0.73 / metro 2
Con una desviación estándar de 1,26.

¿Es este un enfoque razonable? ¿Existe una solución establecida para este problema?

Respuestas (1)

Para mí, hay dos temas que se mezclan aquí (si te entiendo bien). Primero, ¿desea estimar la media y la varianza de una población estadística (es decir, caracterizar una población más grande mediante muestras independientes) o desea calcular la densidad real de un área en particular, donde ha contado todas las ocurrencias en toda esa área? área (pero tal vez dividió el área en subáreas por conveniencia al contar)? Esto no está claro en tu pregunta.

En el segundo caso, su segunda opción de agrupación de conteos y áreas es adecuada. Sin embargo, solo ha calculado la densidad real en esa área en particular (ignorando los problemas de detectabilidad del organismo al contar), y no puede sacar ninguna inferencia sobre una población estadística más grande.

Si su objetivo es sacar inferencias para una población estadística más grande, un comienzo es calcular la media y la desviación estándar (sd) de su muestra. En ese caso, supongo que sus muestras se eligen al azar e independientemente de una población estadística más grande. Su primera opción es entonces el enfoque correcto. Sin embargo, dado que sus muestras tienen diferentes tamaños, es posible que desee otorgar más peso a las muestras más grandes, ya que se puede suponer que describen mejor el promedio de la población que las muestras más pequeñas. Esto se llama una media ponderada .

En general, la media aritmética ponderada se define como:

X ¯ w = i = 1 norte w i X i i = 1 norte w i

dónde w i son los pesos para cada muestra ( X i ) y norte son el número de muestras. Usando esta fórmula, obtendrá exactamente el mismo valor para la media ponderada que calculó en su segundo intento (0.458), si usa las áreas como pesos.

La desviación estándar ponderada es un poco más problemática, en el sentido de que no existe una sola forma estándar de calcularla. Sin embargo, una fórmula comúnmente utilizada es:

σ w 1 = i = 1 norte w i ( X i X ¯ w ) 2 ( METRO 1 ) METRO i = 1 norte w i ,

dónde METRO son el número de pesos distintos de cero. Otras definiciones de la desviación estándar ponderada se pueden encontrar en Wikipedia: varianza de muestra ponderada .

Otra versión se define como (llamada "pesos de confiabilidad" en la página wiki):

σ w 2 = i = 1 norte w i ( X i X ¯ w ) 2 i = 1 norte w i i = 1 norte w i 2 i = 1 norte w i ,

Si no me he equivocado, estos darán las desviaciones estándar de 1.15 y 1.22, usando sus datos.

En cuanto a la interpretación biológica, todos los cálculos de densidades promedio indican una distribución agrupada, ya que el coeficiente de variación (CV) es mayor que 1 (CV = sd/mean), pero más si usa una media ponderada. El CV usando la media aritmétrica es 1.5, mientras que es 2.5-2.65 para la media ponderada, lo cual es razonable ya que le está dando más peso a la muestra de área grande con un conteo de cero. Sin embargo, también debo tener en cuenta que debe tener cuidado al usar una media ponderada cuando tiene una distribución muy agrupada, ya que corre el riesgo de que, por ejemplo, una parcela de muestra grande aterrice en un área sin ocurrencias, lo que podría sesgar su estimación de densidad. Generalmente, cuando tiene una distribución agrupada, necesita muestrear más intensamente para obtener una buena estimación de la densidad promedio, y muchas muestras pequeñas a menudo son mejores que algunas grandes.

Gran respuesta, gracias! Si alguien más aparece y encuentra útil su respuesta, también podría estar interesado en saber que el paquete r SDMTools tiene las funciones wt.mean() wt.sd() y wt.var(). wt.sd() usa la ecuación más común que describió anteriormente.
Después de encontrar más tiempo para considerar su respuesta, tengo una corrección menor en su respuesta y una pregunta de seguimiento. La media ponderada del ejemplo anterior es 1,16, no 0,458 como dices. Y ahora considere estas tres parcelas: Cuenta: 1, 1, 20; área (m2): 1,1,20. Diría que la densidad es 1 animal/m2 y los tres métodos en mi publicación original están de acuerdo. Pero la media ponderada es 18,2. Eso no parece correcto. ¿Cuáles son sus pensamientos sobre esto?
Si obtiene una media ponderada de 1,16, está calculando una media basada en recuentos, no en densidades, y lo mismo ocurre con su nuevo ejemplo. Tampoco tiene mucho sentido calcular el número promedio de ocurrencias (recuentos) para parcelas de diferentes tamaños, que es lo que ha hecho en su ejemplo en el comentario. Si calcula una media (ponderada o no) basada en las densidades, obtendrá 1 animal/m2.
Sí, tienes toda la razón. Por supuesto, usaría las densidades al calcular la densidad ponderada. Cómo no vi eso antes está más allá de mí. Gracias de nuevo.
@AdamC De nada. Tenga en cuenta que he agregado un poco sobre la interpretación biológica y algunos problemas al usar la media ponderada para distribuciones agrupadas.