Soy un investigador y quiero raspar un sitio web (específicamente, TripAdvisor) para recopilar datos a fin de usarlos para un proyecto de investigación. Sin embargo, al leer los términos y condiciones del sitio web , descubrí que la empresa prohíbe al usuario:
... copiar cualquier contenido o información de este sitio web utilizando cualquier robot, araña, raspador u otro medio automatizado o cualquier proceso manual para cualquier propósito sin nuestro permiso expreso por escrito.
-- Actividades prohibidas, viñeta (ii)
Como tal, quiero contactar a la compañía para pedir permiso. He tenido dificultades para encontrar información sobre cómo contactar a la empresa para solicitar permiso para usar los datos. Dicho esto, mi pregunta es, al hacer este tipo de solicitudes a las empresas, ¿cuál es la mejor manera de asegurarme de que me estoy comunicando con el departamento/la persona adecuada?
En primer lugar, reconozca que probablemente colocaron ese ToS allí por algunas o todas las siguientes razones:
Es probable que caigas en la segunda categoría (y tal vez en la cuarta, no sé de qué otras cosas se están protegiendo). En esa medida, debes convencerlos de que no eres un idiota que se volverá loco en sus servidores. Si está alineado con una universidad conocida, tal vez tenga más suerte, pero aun así será difícil... esta es una empresa con fines de lucro, no una institución de investigación. Incluso si puedes convencerlos de que no eres un completo idiota, todavía tienen muy pocas razones para querer otorgarte este permiso. Su proyecto favorito no les reportará nada y, de hecho, puede demostrar algo malo acerca de su sitio que no quieren que sea público. El argumento de "compartiré mis hallazgos" realmente no va muy lejos... las empresas tienen sus propios intereses, regidos por muchas cosas, incluyendo política, agendas, egos y lo que sea. Su presentación de PowerPoint que se puede hacer en uno o dos años y que probablemente será demasiado técnica para que un vicepresidente de negocios la entienda de todos modos no les dará ningún valor comercial.
El objetivo de todas las palabras anteriores es simplemente convencerlo de que tiene una batalla bastante cuesta arriba aquí.
Dicho todo esto, comenzaría a llamar a todos los números de "contacto" que tenga en mis manos. Definitivamente comience con los números en la página "Contáctenos". ¡No tenga miedo de enviar una carta escrita! Para las llamadas telefónicas, me gusta la frase que usó Jack St Claire en su comentario: "Tengo una pregunta extraña".
El éxito es fácil de determinar. Revise su correo... ¿tiene una carta (escrita o electrónica) del equipo legal de TripAdvisor que le permita realizar la investigación? Si no, entonces no has tenido éxito todavía. ¡Sigue intentándolo! La perseverancia será clave aquí.
Sugeriría 2 cosas.
1) póngase en contacto con otros investigadores académicos que obtuvieron estos datos anteriormente (usted menciona en los comentarios que esto sucedió) y pregunte cómo lo hicieron. Esta es realmente su mejor apuesta y lo único que realmente ha funcionado para mí.
2) Use LinkedIn para averiguar quién es probable que maneje dicha solicitud. Para TA podría ser alguien en su departamento legal o en su grupo de aprendizaje automático, tal vez. Al menos puede tener una idea aquí de lo que son los departamentos. He usado este método en el pasado para obtener respuestas a mis solicitudes, aunque fueron "no".
También señalaré que una vez tuve permiso de una empresa para extraer datos y luego la empresa no me cerró, mi universidad lo hizo porque pensó que era un "hacker de China". Luego, ambos departamentos legales se involucraron y recuperaron los datos. Así que intente obtener un conjunto de datos directamente de la empresa, no un permiso para raspar.
Finalmente encuentro ayuda en ResearchGate.com. Un investigador me proporcionó algunas direcciones de correo electrónico que encontró en esta página y sugirió que enviara una solicitud por correo electrónico al director general (Steve Kaufer) solicitando permiso. Le envié una solicitud por correo electrónico y estoy esperando su respuesta. Espero que esto pueda ayudar a cualquiera en el futuro.
usuario60356
moh_bob
usuario60356
moh_bob
supermejor
Jack loco
moh_bob
Amanecer
moh_bob
eykanal
O Mapeador
O Mapeador
moh_bob
O Mapeador
moh_bob