Imaginemos que se muestrean 5 parcelas de diferentes tamaños para una especie objetivo:
plot# count area(m^2) plot_density
1 1 5 0.2
2 3 2 1.5
3 0 10 0.0
4 5 1 5.0
5 2 6 0.33
¿Cuál es la densidad de esta especie? Veo dos formas de calcular la densidad que dan valores completamente diferentes.
La primera forma promedia la densidad en cada parcela:
Esto parece estar bien , pero no hace mucho para controlar los cambios en el tamaño de las parcelas. Por ejemplo, si la parcela 3 anterior fuera 10 veces más grande, la densidad seguiría siendo la misma. En una situación en la que el tamaño de las parcelas está determinado por el entorno (por ejemplo, bajo objetos de cobertura natural), esto parece menos que ideal.
La segunda forma suma los conteos y el área de búsqueda y los divide:
Prefiero el segundo método porque parece describir la densidad de los animales con mayor precisión. Y me encantaría usar el segundo método, pero mi problema es que no estoy seguro de cómo calcular una estadística de resumen para el método dos, ya que nunca se calculó la media. El método uno da una desviación estándar de 2.1. ¿Cuál es la desviación estándar para el método dos?
Una posible solución que se me ocurrió consiste en dividir las parcelas más grandes en parcelas de 1 m ^ 2 y dividir la cantidad de animales en esas parcelas más pequeñas. Así que ahora tengo 24 parcelas de 1 m ^ 2 con los siguientes "recuentos":
plot# count area(m^2) plot_density
1-5 0.2 1 0.2
6-7 1.5 1 1.5
8-17 0.0 1 0.0
18 5.0 1 5.0
19-24 0.33 1 0.33
Ahora, usando la primera ecuación anterior obtengo:
¿Es este un enfoque razonable? ¿Existe una solución establecida para este problema?
Para mí, hay dos temas que se mezclan aquí (si te entiendo bien). Primero, ¿desea estimar la media y la varianza de una población estadística (es decir, caracterizar una población más grande mediante muestras independientes) o desea calcular la densidad real de un área en particular, donde ha contado todas las ocurrencias en toda esa área? área (pero tal vez dividió el área en subáreas por conveniencia al contar)? Esto no está claro en tu pregunta.
En el segundo caso, su segunda opción de agrupación de conteos y áreas es adecuada. Sin embargo, solo ha calculado la densidad real en esa área en particular (ignorando los problemas de detectabilidad del organismo al contar), y no puede sacar ninguna inferencia sobre una población estadística más grande.
Si su objetivo es sacar inferencias para una población estadística más grande, un comienzo es calcular la media y la desviación estándar (sd) de su muestra. En ese caso, supongo que sus muestras se eligen al azar e independientemente de una población estadística más grande. Su primera opción es entonces el enfoque correcto. Sin embargo, dado que sus muestras tienen diferentes tamaños, es posible que desee otorgar más peso a las muestras más grandes, ya que se puede suponer que describen mejor el promedio de la población que las muestras más pequeñas. Esto se llama una media ponderada .
En general, la media aritmética ponderada se define como:
dónde son los pesos para cada muestra ( ) y son el número de muestras. Usando esta fórmula, obtendrá exactamente el mismo valor para la media ponderada que calculó en su segundo intento (0.458), si usa las áreas como pesos.
La desviación estándar ponderada es un poco más problemática, en el sentido de que no existe una sola forma estándar de calcularla. Sin embargo, una fórmula comúnmente utilizada es:
dónde son el número de pesos distintos de cero. Otras definiciones de la desviación estándar ponderada se pueden encontrar en Wikipedia: varianza de muestra ponderada .
Otra versión se define como (llamada "pesos de confiabilidad" en la página wiki):
Si no me he equivocado, estos darán las desviaciones estándar de 1.15 y 1.22, usando sus datos.
En cuanto a la interpretación biológica, todos los cálculos de densidades promedio indican una distribución agrupada, ya que el coeficiente de variación (CV) es mayor que 1 (CV = sd/mean), pero más si usa una media ponderada. El CV usando la media aritmétrica es 1.5, mientras que es 2.5-2.65 para la media ponderada, lo cual es razonable ya que le está dando más peso a la muestra de área grande con un conteo de cero. Sin embargo, también debo tener en cuenta que debe tener cuidado al usar una media ponderada cuando tiene una distribución muy agrupada, ya que corre el riesgo de que, por ejemplo, una parcela de muestra grande aterrice en un área sin ocurrencias, lo que podría sesgar su estimación de densidad. Generalmente, cuando tiene una distribución agrupada, necesita muestrear más intensamente para obtener una buena estimación de la densidad promedio, y muchas muestras pequeñas a menudo son mejores que algunas grandes.
adán c
adán c
archivobajo el agua
adán c
archivobajo el agua