Ética del uso de datos de la empresa de pasantías para proyectos académicos

Soy estudiante de posgrado y uno de mis proyectos de investigación requiere que rastree un sitio web usando su API pública. Esto va bien, pero la cantidad de datos que podemos recopilar es limitada, ya que es una API pública.

Da la casualidad de que haré una pasantía en la empresa propietaria de ese sitio web y pronto tendré acceso a un suministro ilimitado de sus datos. ¿Está bien si uso esos datos para mi proyecto de investigación académica, o esperarán que solo use sus datos para proyectos relacionados con mi pasantía?

Es casi seguro que necesitará el permiso de la empresa. Espero que tengas que firmar un NDA. También puede ser más difícil publicar sus resultados si no puede compartir sus datos con los revisores.
"¿Esperarán que solo use sus datos para proyectos relacionados con mi pasantía?" - ¿Por qué no simplemente les preguntas?
No se trata de ética, en realidad, sino de derecho.
Obviamente, los datos públicos están bien para la investigación académica, pero no exponga los datos privados de los clientes a través de publicaciones de investigación, independientemente de si existe o no un NDA. Te garantizo que serías persona non grata en tu industria si haces eso. Cualquier empresa que descubra que usted expuso información corporativa privada de un cliente lo excluiría de facto. Sé con certeza que si alguna vez descubro que publicaste datos privados de cualquier empresa para la que trabajaste, nunca trabajarías para mí; Me aseguraría de ello.
Tienes que pedir permiso. Los datos resumidos agregados pueden estar bien, pero los datos propietarios probablemente no lo estén.
Sugiero que es posible que ya estés condenado antes de preguntar. Dependiendo de la naturaleza de su investigación, debe estar preparado para ser un paria en el mundo corporativo por exponer públicamente datos corporativos privados o un paria en la comunidad de investigación por un chelín para un cliente, ya sea que use o no sus datos privados para su proyecto de investigación. . Si su resultado no es halagador para la Corporación A, podría ser excluido. Si su resultado es halagador para la Corporación A, podría ser considerado un cómplice corporativo. Si sus resultados están en el medio, a nadie le importarán sus hallazgos.

Respuestas (5)

Deberías preguntar en la empresa donde haces tus prácticas. Tal vez estén bien con lo que sea que quieras hacer. Tal vez le permitan usar sus datos, pero solo publicarán resúmenes, no los datos sin procesar. Tal vez le pedirán que lo anonimice.

Además, ¿cómo harás el análisis? ¿Tomará los datos de la empresa y los transferirá a su propia computadora? (Es posible que esto no sea bien recibido por la empresa). ¿O planea utilizar una máquina suministrada por la empresa para realizar sus análisis? (El mismo problema: a las empresas no necesariamente les gusta que use su hardware para lo que son esencialmente tareas personales). ¿Quiere instalar software de terceros para analizar sus datos en sus máquinas?

Piense en lo que quiere hacer, luego vaya a su supervisor. Dependiendo de su personalidad, las personas pueden incluso estar interesadas en trabajar contigo en esto, tal vez sacar una publicación de eso.

Hagas lo que hagas, no, no , no uses los datos sin preguntar. Ya sea que firme o no un NDA.

Énfasis fuerte, fuerte en "no". Podría meterte en serios problemas.

Pregúnteles y vea lo que tienen que decir. Una cosa es rastrear su API pública en su propio tiempo (lo que en realidad puede impedirle específicamente hacer su investigación de acuerdo con sus términos de uso), pero usar sus datos internos directamente sin preguntar sería poco ético en el mejor de los casos y potencialmente ilegal en el peor. (y lo último que querría es ser conocido como el tipo que robó la información personal de las personas para su propio beneficio y luego lo llevaron a los tribunales cuando lo hicieron público) mientras que su investigación solo puede contener datos agregados o conjuntos de datos anónimos, entonces eso todavía no cambiará la percepción de los posibles futuros empleadores.

  • Tienes que pedir permiso, por escrito [*]. No use los datos sin preguntar, eso sería definitivamente poco ético. Si se muestran reacios o tienen inquietudes sobre la confidencialidad o la seguridad, usted (y/o su supervisor de investigación) deben presentarles el caso en términos de cómo se beneficiarán de las publicaciones y la exposición: reputación, contratación, etc. Lleve a cabo esta negociación. en el nivel apropiado más alto que pueda administrar, es decir, involucre a las personas que tienen la autoridad para decir que sí y que están realmente incentivadas para hacerlo. (También es bueno para el reconocimiento de su carrera). A veces, necesita que el departamento de ingeniería empuje al departamento legal en su nombre o anule políticas estúpidas.
  • Defina si puede/debe anonimizar/doble-anonimizar/agregar/muestrear/difuminar los datos (por ejemplo, mire cómo lo hace el Censo). O tal vez solo use campos no identificables. Es posible que le pidan que realice esfuerzos razonables para protegerlo (contraseña, cifrado, firewall, disco duro externo), pero no acepta una indemnización ilimitada.
  • Trate de que el acuerdo sea lo más amplio posible, es decir, sin límites de tiempo, sin límites en el alcance (no comercial), permita trabajos derivados suyos, de su departamento o de sus co-investigadores. Los acuerdos casi siempre prohibirán el uso comercial derivado. Si se te ocurre una idea patentable, ¿quién tiene los derechos? etc.

[*] ACTUALIZACIÓN: pesadillas como la siguiente (una política de propiedad intelectual retrospectiva) son precisamente el tipo de cosas que pueden suceder: "Estudiante de doctorado, emitió un contrato en el año 3 que firmará la propiedad intelectual. ¿Es legal?" . Ahora esa persona puede tener todas sus publicaciones vetadas y su tesis cerrada por el socio industrial.

@StephanKolassa: diablos, sí. ¿Qué pasa si un par de años más tarde, los gerentes originales con los que trató han cambiado, o desea hacer un trabajo derivado o de seguimiento, o dar acceso a sus co-investigadores, o la empresa simplemente cambia de opinión, o le quita prioridad a la colaboración, o su contacto se va... Y mucho menos meterse en desacuerdos sobre IP, y quién posee o no qué, o descubrió o no qué. Todas estas cosas pueden pasar.
El único peligro es que si quiere algo por escrito, pueden llamar a los abogados. En cuyo caso, todo se complicará mucho más y tomará mucho más tiempo.
@StephanKolassa: sí, seguro. Tienes que desarrollar un sentido de lo que se puede lograr y asegurarlo por escrito, por adelantado, bastante rápido. A menudo, simplemente no vale la pena definir los derechos de PI, o es posible que ya estén cubiertos por un acuerdo marco (o acuerdo verbal) entre la universidad y la empresa. Las culturas de empresa en todo esto difieren inmensamente. A menudo, identificar a la persona/conjunto de personas en la empresa que está incentivada para decir que sí y que tiene la autoridad para hacerlo es una gran parte de ello. Y a veces educativo en sí mismo. O revelador.
@StephanKolassa: el escenario de pesadilla es que no quieres hacer un montón de trabajo y luego tener una publicación embargada o retenida por el socio...

Haré una pasantía en la empresa propietaria de ese sitio web y pronto tendré acceso a un suministro ilimitado de sus datos. ¿Está bien si uso esos datos para mi proyecto de investigación académica?

¡NO!

No con la misma fuerza que la respuesta a la pregunta: "Estoy investigando sobre salarios en diferentes profesiones. Un amigo me ha invitado a cenar la próxima semana. ¿Está bien si reviso su archivador para ver si puedo encontrar una nómina?"

Si desea utilizar los datos de alguien y esos datos no son inequívocamente públicos, primero debe obtener su permiso explícito. En un entorno corporativo, hay muchas razones por las que se puede denegar el permiso: por ejemplo, los datos pueden ser comercialmente confidenciales o la empresa puede tener obligaciones de privacidad hacia sus clientes. El hecho de que necesite acceso privilegiado para obtener los datos debería indicarle de inmediato que necesita permiso para usarlos por cualquier otra razón que no sea la razón específica por la que se le otorgó ese acceso.

Lo que está hablando de hacer es técnicamente considerado espionaje corporativo sin el permiso explícito del cliente.

Hechos (como usted los ha expuesto):

  1. Está realizando una investigación académica consumiendo datos públicos de la Corporación A
  2. Realizará una pasantía en Corp A y tendrá acceso a la información privada de Corp A
  3. Su capacidad dentro de Corp A es independiente de su investigación académica que involucra a Corp A.
  4. Al menos está contemplando la idea de utilizar los datos privados de Corp A con fines de investigación sin su consentimiento.

Por lo tanto, mi recomendación depende completamente de la naturaleza de la relación entre su pasantía en la Corporación A y su conocimiento de su proyecto de investigación que involucre sus datos.

Si sabían de tu proyecto de investigación antes de concederte una pasantía, me parece totalmente adecuado pedirles permiso.

Si no sabían sobre su proyecto de investigación antes de otorgarle una pasantía, usted pone en riesgo su pasantía al pedir permiso para usar sus datos privados, según la sensibilidad de los datos a los que tendría acceso y las personalidades de los miembros de la empresa. en control de su relación con la corporación. Los riesgos asociados con la violación de su denegación de su solicitud podrían ser más problemáticos de lo que valen.

Si no sabían sobre su proyecto de investigación antes de otorgarle una pasantía y usted publica datos corporativos privados sin consentimiento explícito, tienen un reclamo legítimo de que buscó su pasantía con ellos con el propósito expreso de obtener acceso dudoso a su información privada y usted estaría en un mundo de daño tanto legal como profesionalmente. Dependiendo de las consecuencias de eso, podría esperar razonablemente que nunca vuelva a ser empleable en su campo y podría esperar razonablemente encontrarse en prisión dependiendo de la naturaleza de los datos que exponga y la influencia política que tiene. la gente que te cabrea.

Editar para agregar

Es posible que ya estés entre Scylla y Charybdis en esto. Mire la óptica potencial: tiene un proyecto de investigación (cuya naturaleza no ha revelado). También tiene una pasantía con acceso a datos privados corporativos de uno de los sujetos de su estudio de investigación. Suponiendo que no anuncie su proyecto de investigación y realice la pasantía, su posición tanto dentro de su comunidad académica como dentro del mundo corporativo definitivamente dependerá de la naturaleza y los resultados de su proyecto de investigación.

Si realiza una pasantía con ellos y luego los crucifica en su proyecto de investigación, su quid pro quo será recíproco, independientemente de si consienten o no en que usted publique sus datos privados. Con el acceso a sus datos privados, su metodología de investigación será cuestionada (quizás legalmente) y cualquier posible error que haya cometido se verá exacerbado. Si sus resultados son halagadores para la Corporación A, entonces sus pares académicos pueden considerar que usted está en deuda política con la Corporación A.

Es posible que ya se encuentre en un escenario sin salida que no sea cancelar su proyecto de investigación o cancelar su pasantía. Realmente se supone que no debes hacer lo que estás pensando hacer.