¿Por qué solo se pueden incluir algunos trabajos de una conferencia en Google Scholar?

¿Por qué algunas publicaciones no están incluidas en Google Scholar, mientras que otras sí, para la misma conferencia?

Por ejemplo, hay una serie de documentos sobre Black Hat:

https://www.blackhat.com/docs/us-15/materials/us-15-Arnaboldi-Abusing-XSLT-For-Practical-Attacks-wp.pdf

https://www.blackhat.com/docs/us-15/materials/us-15-Evenchick-Breaking-Access-Controls-With-BLEKey-wp.pdf

Pero cuando los busca, como "Abuso de XSLT para ataques prácticos" en Google Scholar, no hay ningún resultado. Son papeles del 2015, ha pasado un año desde entonces.

Además, cumplen con el requisito de inclusión de Google Scholar: https://scholar.google.com/intl/en/scholar/inclusion.html

Sin embargo, algunos otros trabajos en la misma conferencia (Black Hat USA 2015), están incluidos en Google Scholar.

Entonces, ¿cuáles son los estándares reales para que las publicaciones se incluyan y se puedan buscar en Google Scholar?

Google Scholar es bastante impredecible: utiliza un rastreador que no se selecciona manualmente. No me sorprendería del todo si el material simplemente no se recoge por varias razones.
Su título y pregunta general son apropiados (es decir, por qué se incluyen algunas publicaciones, mientras que otras no), pero si solo está realmente interesado en saber por qué Google Scholar no indexa bien los documentos de la conferencia Black Hat, entonces debe preguntar eso como un pregunta especifica De lo contrario, la información de los criterios de inclusión de Google Scholar (que usted vincula) responde adecuadamente a su pregunta general. El caso Black Hat es una pequeña excepción. Sin embargo, si Black Hat es lo que realmente le interesa, entonces haga que ese sea el tema de su pregunta, no solo "un ejemplo".

Respuestas (1)

Investigando un poco, encontré que la mayoría de los artículos sobre BlackHat 2015 no figuran en Google Scholar, y todos los artículos que encontré en la lista fueron citados por otros documentos.

Entonces, me parece probable que este se encuentre entre los sitios de "área gris" que Google Scholar no está indexando (el estado de BlackHat como una conferencia académica es turbio) y, por lo tanto, que cualquier material que encuentre se agregue al índice de Google Scholar a través de otras rutas.

¿Cuáles son las "otras rutas"? Si el artículo tiene una cita, ¿se rastreará?
@WindChaser Google infiere registros de publicación a partir de citas, incluso si no puede encontrar el documento original.
Si es así, ¿cómo enlaza Google Scholar el archivo PDF encontrado con la entrada de la publicación (que anteriormente no tenía ningún PDF disponible)?
@WindChaser No soy un ingeniero de Google, así que no lo sé con certeza, pero supongo que Google encuentra todos los archivos PDF con el resto de su rastreo web, y no es tan difícil vincularlos cuando Scholar descubre que se trata de una publicación científica.