Estoy interesado en usar Mechanical Turk como un medio para reclutar participantes para estudios de psicología en línea. Nunca lo he usado para ninguna investigación. Sin embargo, muchos de mis estudios tardan entre 30 minutos y una hora en completarse. Un estudio típico podría involucrar responder un conjunto de cuestionarios usando Inquisit. Mi impresión es que Mechanical Turk funciona mejor con estudios breves (es decir, de uno a cinco minutos).
En general, aprecio que los estudios más largos requieran una remuneración mucho mayor, probablemente más que un múltiplo de la cantidad de tiempo. También me imagino que habría problemas adicionales de control de calidad.
Acabo de empezar a leer sobre Mechanical Turk. Este es un resumen de algunos de los consejos que he encontrado. Es cierto que la mayor parte se aplica generalmente a los experimentos psicológicos, y no específicamente a los más largos.
David Sharek analiza su flujo de trabajo que incluye explícitamente estudios en el rango de 30 minutos . Así, este post es uno de los más relevantes para tratar el tema de los estudios más largos.
Aquí hay algunos otros recursos variados; ver también las referencias en la parte inferior.
Varios blogs relevantes para Mechanical Turk mencionados por Buhrmester
El modelo general parece ser tener un enlace a un sitio externo (asegúrese de que se abre en una nueva pestaña o ventana) donde se entrega la encuesta y un cuadro para ingresar el código de finalización.
Buhrmester analiza varios sistemas de códigos de finalización y optó por la opción de tecnología relativamente baja de hacer que los participantes inventen un número de 4 o 5 dígitos y lo ingresen tanto en la encuesta como en el mturk. Luego usa datos de marca de tiempo para verificar el completador original.
Estado de Mason y Suri
Sin embargo, investigaciones recientes sobre el comportamiento de los trabajadores (Chilton et al., 2010) demostraron que los trabajadores tenían un salario de reserva (la cantidad mínima de pago por la que harían la tarea) de solo $ 1.38 por hora, con un promedio efectivo por hora. salario de $4,80 para los trabajadores (Ipeirotis, 2010a).
En cuanto a la relación entre el pago y la calidad del trabajador, citan estudios que sugieren que existe una relación positiva inicial que se nivela en cierto punto, de modo que en cierto punto el pago adicional no mejora el desempeño. Masson y Suri luego sugieren:
En consecuencia, a menudo es recomendable comenzar pagando menos del salario de reserva esperado y luego aumentar el salario si la tasa de trabajo completado es demasiado baja.
Del mismo modo, los salarios hasta cierto punto deberían aumentar la velocidad de recopilación de datos.
Con respecto al rechazo de aciertos, Michael simplemente ha aceptado todos los aciertos. Esto puede ser más simple que tratar de averiguar qué hits son legítimos. Esto también tenía sentido dado que a menudo solo pagaba 10 centavos por participante por experimentos de 10 minutos. También tiene la ventaja de no dañar su reputación.
Hay dos problemas aquí. ¿El participante completó el estudio en absoluto? ¿Y completaron el estudio de manera adecuada (p. ej., probando una tarea de desempeño, leyendo las instrucciones correctamente, etc.)?
Un enfoque general es incorporar medios adicionales a los habituales para detectar datos dudosos. Si es sencillo filtrar a dichos participantes, entonces no corrompen el conjunto de datos final.
Algunas ideas:
Buhrmester hace la observación causal de que la calidad de las respuestas puede variar según el país de los encuestados, por lo que, por ejemplo, la participación limitada a los participantes de EE. UU. es un medio burdo para filtrar la calidad.
Buhrmester menciona aceptar todos los hits tanto por simplicidad como por administrar la reputación.
Mason y Suri (2012) analizan cómo se analiza y monitorea la reputación en sitios externos.
Turkopticon es un sitio que permite a los trabajadores calificar a los solicitantes en cuatro ejes: comunicatividad, generosidad, equidad y prontitud. Turker Nation es un tablero de anuncios en línea donde los trabajadores comentan rutinariamente sobre los solicitantes y se comunican sobre HIT individuales. Se recomienda encarecidamente que los nuevos solicitantes se “presenten” a sí mismos en la comunidad de Mechanical Turk publicando primero en Turker Nation antes de publicar HIT.
Es posible que desee echar un vistazo a SurveyComet.com y TurkPrime.com . Ambos ofrecen un conjunto bastante bueno de herramientas para ejecutar encuestas alojadas externamente (como en Qualtrics y SurveyMonkey) y le permiten crear encuestas de seguimiento, excluir a trabajadores anteriores, tener paneles demográficos específicos y mucho más.
Una encuesta larga se puede dividir en dos partes. Inicie la parte 1 y luego la parte 2 como un seguimiento que solo estará abierto a aquellos que participaron en la parte 1.
Descargo de responsabilidad: formo parte del equipo de desarrollo de software y actualmente estoy trabajando en esos sitios.
jeff
Ofri Raviv
Jeromy Anglim
Jeromy Anglim