Uso de datos de perfil público del sitio web para investigación

Un miembro de nuestro departamento planea descargar millones de perfiles de un sitio web público. Se puede acceder libremente a los datos una vez que haya iniciado sesión, aunque hay una empresa detrás del sitio web que tiene intereses comerciales y vende membresías premium. Los términos y condiciones del sitio web no prohíben explícitamente la descarga masiva de información y afirma que su software simularía el comportamiento normal del usuario, por lo que no interferiría con las operaciones normales del sitio.

Una evaluación preliminar de nuestro comité de ética sugiere que, desde un punto de vista ético, todo estaría bien siempre y cuando no publique el conjunto de datos (lo que no planea hacer) y los datos sean anónimos. Además, agregará los datos, por lo que ninguna información relativa a las personas será inteligible.

Aún así, no estoy completamente convencido de que se deba hacer este estudio y la votación final aún está pendiente. ¿Hay otras cosas a considerar? ¿Podría la empresa que opera el sitio web demandar a la universidad (o a él) por usar los datos o sería tolerado por una ley que protege la libertad de prensa o algo similar? Estamos en Alemania, por lo que se aplica la legislación alemana y de la UE.

Lo que está describiendo es la publicación de datos de OKCupid , solo que sin publicar el conjunto de datos. Recomiendo consultar con un abogado sobre los términos y condiciones del sitio web. O obtener una aprobación del sitio web.
Recomiendo encarecidamente hablar con la empresa propietaria del sitio web. A menos que la investigación pueda arrojarles una mala luz, también pueden estar interesados ​​​​en aprender algo sobre su base de usuarios. Además, podrá conocer información relevante sobre los datos, como mecanismos ocultos de selección o similares.
(Siendo realistas, nadie aquí puede decirle la probabilidad de ser demandado o de perder la demanda. Una demanda probablemente se basaría en los términos y condiciones del sitio web; pídale a un abogado que los revise. La evaluación de su colega de que "no prohibir explícitamente la descarga masiva de información" no es precisamente tranquilizador.)
¿Cómo guarda Google una gran cantidad de sitios web en caché si no los descarga inicialmente? ¿Violarían todos los sitios web? ¿Independientemente de los términos y condiciones? Por otro lado, he escuchado varias veces que está prohibido raspar cualquier tipo de sitio web en Alemania sin la autorización del propietario del sitio web.
@Michael Google respeta el archivo robots.txt, que da permiso (o no) a los motores de búsqueda para raspar el contenido del sitio. Es como un T&C para motores de búsqueda. Además, Google ha sido demandado por almacenar contenido en caché por motivos de derechos de autor (ganaron la demanda, pero aun así). Finalmente, cuando se trata de la ley, es bastante peligroso asumir "Esto tiene algunas similitudes con lo que quiero hacer y parece legal, probablemente nadie me demandará tampoco" ;) Los sitios web se benefician de lo que hace Google; no tienen ninguna razón para demandar (por lo general).
@ ff524 Estoy al tanto de robots.txt, sin embargo, como dijiste, esto no da permiso para raspar realmente, solo para ser visitado. Y no estaba optando por "Google lo hace, así que tú también puedes" :) Interesante que hayan ganado la demanda. Gracias por la info
@Michael Lea más sobre esa demanda, en caso de que esté interesado.
El lanzamiento de OKCupid suena muy interesante. ¡Gracias por eso! Un miembro del comité de ética también sugirió ponerse en contacto con los propietarios del sitio web, aunque parecía reacio, probablemente porque si decían que no, su estudio terminaría incluso antes de que comenzara. Es poco probable que su investigación arroje una mala imagen sobre ellos, aunque probablemente consideren su información como su secreto comercial y no estén dispuestos a compartir nada (pero puedo presionarlo para que lo haga de todos modos). Como señaló @ff524, Google respeta el archivo robots.txt, que no permitiría descargar información de miembros para este sitio web.
@ ff524 ¿Puede convertir sus comentarios en una respuesta?

Respuestas (1)

Lo que está describiendo es la publicación de datos de OKCupid , solo que sin publicar el conjunto de datos. Tenga en cuenta que el "estudio" de OKCupid y estudios similares sobre los datos de Facebook fueron considerados éticamente controvertidos por algunos, quienes argumentan que los usuarios que participan en un sitio web no necesariamente están dando su consentimiento para participar en un estudio de investigación, especialmente cuando los datos del perfil de los usuarios solo están disponibles. a los usuarios registrados. (Ver también: “Pero los datos ya son públicos”: sobre la ética de la investigación en Facebook de Michael Zimmer.)

Re: para evitar una demanda, debe obtener la aprobación del sitio web. Como señaló Wrzlprmft en un comentario:

A menos que la investigación pueda arrojarles una mala luz, también pueden estar interesados ​​​​en aprender algo sobre su base de usuarios. Además, podrá conocer información relevante sobre los datos, como mecanismos de selección ocultos o similares.

Si elige no seguir ese camino, le recomiendo consultar con un abogado sobre los términos y condiciones del sitio web. Siendo realistas, nadie aquí puede decirle la probabilidad de ser demandado o de perder la demanda. Una demanda probablemente se basaría en los términos y condiciones del sitio web; obtener un abogado para revisarlos. La evaluación de su colega de que "no prohíben explícitamente la descarga masiva de información" no es precisamente tranquilizadora. (Por ejemplo, el lenguaje en los términos y condiciones que enumera el uso permitido del sitio web puede potencialmente excluir otros usos, sin enumerar explícitamente los usos prohibidos).

La jurisprudencia sobre este tema está lejos de estar resuelta. Las decisiones hasta ahora han sido limitadas. No existe un precedente legal que establezca claramente que "siempre se permite el raspado si los T&C no lo prohíben explícitamente". Hay algunos casos seleccionados que han comenzado a trazar casos en los que el raspado está y no está prohibido, pero el territorio legal aún no se explora por completo. Algunas lecturas adicionales sobre la jurisprudencia en los EE. UU. y la UE: