Diferentes efectos de la probabilidad de detección entre los datos de presencia y de conteo en la misma ubicación

Estoy modelando la idoneidad del hábitat para un animal grande y móvil utilizando datos de ocurrencia (solo presencia, no tengo datos de ausencia real en este caso) recopilados de cámaras trampa (estaciones con cámaras automáticas de detección de movimiento/calor). En cada ubicación de cámara trampa tengo registradas de 0 a varias ocurrencias.

Por lo general, cuando se modelan dichos datos, se modelan como datos de conteo y se incluye la probabilidad de detección para mitigar las covariables que afectan la detección, que de otro modo podrían identificarse como covariables que afectan la idoneidad. Por ejemplo, un área donde la detección es menos probable debido a, digamos, una vegetación densa, puede confundirse como menos adecuada debido a la estructura de la vegetación cuando, de hecho, puede no ser el caso (o incluso puede ser cierto lo contrario).

Mi pregunta es, si la variable de conteo se usara en su lugar como una variable de detección/no detección (por lo tanto, un binario), la probabilidad de detección tendría un efecto menor en el modelo (*al modelar la idoneidad relativa, no la probabilidad de ocurrencia)? es decir, si no tuviera en cuenta la probabilidad de detección, ¿usar una variable de respuesta binaria le daría una estimación menos sesgada de la idoneidad del hábitat que si usara datos de conteo? Y si es así, ¿por qué? No parece que la probabilidad de detección cambiaría, o sería más homogénea en el área de estudio con este cambio, pero parece que los efectos serían de menor magnitud al no reforzar las diferencias en la probabilidad de detección con múltiples ocurrencias.

Además, entiendo que no es deseable descartar todas las demás ocurrencias suponiendo que pueda calcular la probabilidad de detección. Estoy preguntando esto en un intento de comprender mejor las posibles diferencias en el resultado entre estos dos enfoques de modelado cuando se usan dichos datos, ya que he visto ambos métodos en la literatura, pero no he visto que esta pregunta se aborde específicamente. Si pudiera hacer referencia a alguna publicación que pueda arrojar luz sobre esto, estaría muy agradecido.

¿Tiene de alguna manera la opción de estimar la probabilidad de detección durante una temporada, por ejemplo, al poder identificar a los individuos en las imágenes? ¿Tiene datos de varios años o de un solo año?
sí, eso en realidad ya se ha hecho. los datos de los que hablo se usaron para modelar la ocupación con un modelo de captura/recaptura. la probabilidad de captura fue de 0,05.

Respuestas (2)

Descargo de responsabilidad: no es realmente una respuesta, pero es demasiado larga para un comentario.


Si lo entiendo correctamente, esto debe depender completamente de la probabilidad acumulada de detección durante todo el período de detección (el tiempo que las cámaras estuvieron apagadas). Si la probabilidad acumulada de detección en todos los tipos de hábitat es alta (cerca de 1, dado que el animal está presente), entonces la probabilidad de detección no debería ser un problema para la variable de ocurrencia binaria. Una indicación de esto sería si tiene sitios (cámaras) con cero o un número muy alto de ocurrencias, lo que debería indicar que la ocurrencia binaria es bastante sólida. Por otro lado, si los sitios tienen de 0 a 4 ocurrencias en total, será extremadamente difícil separar la no ocurrencia de los factores aleatorios o la detectabilidad. Sin embargo, supongo que se desconoce la probabilidad de detección en todos los hábitats (así como la probabilidad acumulada de detección), pero es posible que pueda hacer una conjetura informada. Además, al utilizar una respuesta binaria, excluirá por completo la posibilidad de estimar, por ejemplo, un efecto de la calidad del hábitat (por ejemplo, una diferencia en la abundancia entre hábitats), ya que los recuentos de 1 o 13 estarán representados por 1 en la variable de detección binaria. . En la Q, hablas de "modelando la idoneidad relativa ", lo que indica que de hecho está interesado en algo similar a esto (calidad relativa del hábitat). En ese caso, creo que una respuesta binaria será demasiado tosca para proporcionar información útil.

Un posible escenario de juguete podría ser que tenga dos tipos de hábitat A y B (10 ubicaciones de cámara/sitios de cada uno) con una variable de detección binaria como:

A: 1 1 1 0 1 0 1 1 0 1 (especies encontradas en 7 sitios)
B: 0 1 0 0 1 0 1 1 0 0 (especies encontradas en 4 sitios)

En ese caso, la especie obviamente puede existir en ambos tipos de hábitat (como los ha categorizado), por lo que la mayor cantidad si los ceros en B pueden representar (entre otras cosas) 1) menor ocupación de este hábitat (en una perspectiva metapop), 2) que la calidad de B es heterogénea, lo que no se refleja en su categorización de hábitat (por lo que partes de B son tan adecuadas como A), 3) menor abundancia de población en B en comparación con A (pero la misma detectabilidad), o 4) menor detectabilidad en B en comparación con A (pero la misma abundancia). Realmente no veo cómo puede separar estos casos solo con la variable binaria, y no creo que usar una variable de detección binaria resuelva ningún problema específico en comparación con el uso de los datos de conteo.

Todo esto es muy confuso, pero con suerte puede brindarle algunas ideas/perspectivas útiles.

gracias por la completa respuesta Estaba pensando en la misma línea que su primer punto: que la probabilidad de detección acumulada durante el período de detección podría ser lo suficientemente alta como para no causar problemas importantes al usar datos binarios. El período de detección fue de 20 días, se utilizaron más de 300 trampas y se generaron más de 100 ubicaciones de ocurrencia (~180 detecciones). los recuentos oscilan entre 0 y 5. el único problema específico que resolvería el uso de datos binarios es el problema del tiempo y la experiencia del usuario. se planteó la cuestión de si se podría utilizar un método más fácil de usar (por ejemplo, maxent) con estos datos para hacer inferencias significativas.

Para poder separar la abundancia de la probabilidad de detección, debe tener un animal marcado. Si este es el caso, puede crear un historial de captura para cada animal y modelar la probabilidad de detección.

Eche un vistazo a este artículo: http://www.sciencedirect.com/science/article/pii/S0006320712005071 . Para algunas recomendaciones sobre el uso de modelos espacialmente explícitos cuando se utilizan cámaras trampa para estimar parámetros de población (abundancia...).

Para responder a su pregunta, en teoría, si hay independencia entre la detección en un sitio, el uso de datos binarios subestimará la probabilidad de detección, pero si su detección depende, digamos que el animal se mueve en un grupo, por lo que cada vez que detecta un animal tiene una fuerte la posibilidad de detectar más de uno y luego usar datos binarios tendría sentido.

Espero eso ayude !

Salud

Nico: entiendo la relación entre la probabilidad de detección y la abundancia, el marcado y la recuperación, y por qué es necesario tenerlo en cuenta. Sin embargo, mi pregunta es si no tuviera en cuenta la probabilidad de detección, ¿usar una variable de respuesta binaria le daría una estimación menos sesgada de la idoneidad del hábitat que si usara datos de conteo? Y si es así, ¿por qué?
¿Todo depende de si su detección es dependiente o independiente? ¿Cuál es el animal que estás estudiando?
Supongamos que son independientes y que es un gran felino.
y en su modelo, su variable ''y'' es la ocurrencia del felino que está estudiando? Y tu pregunta es: ¿Hay más probabilidad de detectar un felino en un hábitat específico?
no realmente, supongo que podría enmarcarlo como una cuestión de "probabilidad de detección". pero enmarquémoslo como una pregunta de modelado de hábitat muy básica: dado este conjunto de lugares de ocurrencia, ¿cuál es el hábitat adecuado para esta especie? Sé que la probabilidad de detección puede sesgar esa estimación. mi pregunta es si el sesgo disminuiría si se usan datos binarios.
Ok, entonces en este caso diría que usar datos binarios versus datos de conteo subestimaría la probabilidad de detección ya que asume independencia entre su detección. Pero la única forma en que podrías afirmar eso es si tuvieras un animal marcado. Cuando obtienes "estación" con más de 1 detección, ¿se cierran a tiempo? ¿Cómo detectas dos felinos en la misma hora o en 12 horas?
Nico: no estoy hablando de estimar la probabilidad de detección, estoy hablando de estimar la idoneidad del hábitat y cómo estos dos tipos de datos afectan esa estimación dada la detección imperfecta.