Probablemente, todos los ingenieros de software se encontraron con una entrevista en la pizarra. Por el bien de la pregunta, digamos que la entrevista de pizarra es la entrevista, donde al candidato se le da un problema para resolver en una pizarra, sin usar herramientas de desarrollo reales. Y el tema del problema probablemente sea algoritmos y estructuras de datos.
Si busca en Internet 'entrevista de pizarra', parece que ese concepto se ve como algo negativo. La razón principal parece ser que la gente piensa que el resultado de la entrevista de pizarra no se parece al entorno de trabajo. Por lo tanto, no puede mostrar la capacidad del candidato para realizar el trabajo. Y es visto como injusto por ambos lados del proceso de contratación: 1 2 3 .
Pero todos estos artículos están basados en experiencias de una o varias personas. Entonces , ¿hay alguna investigación científica sobre la efectividad de las entrevistas de pizarra? No espero que la investigación científica responda a la pregunta "¿Son malas las entrevistas de pizarra?". Pero esperaría algo en la línea de
Creemos que las entrevistas de pizarra son buenas para entender X sobre el candidato. Medimos la "bondad de X" usando la métrica Y. Y medimos el rendimiento de la entrevista utilizando Z . Aquí está la dependencia de Y(Z) , a partir de la cual concluimos, asumiendo que Y es una buena métrica de X , que las entrevistas de pizarra son lo suficientemente buenas/malas para comprender X .
Es un problema difícil elegir X e Y. Pero sospecho que los científicos inteligentes aún pueden encontrar algún modelo.
Por ejemplo. Tal vez X podría ser la eficacia de la persona , que es realmente difícil de medir, pero las grandes empresas aún intentan hacerlo con evaluaciones de desempeño. Digamos que Y es el promedio de las tres primeras calificaciones de revisión . Y Z será el promedio de las calificaciones de los revisores . ¿Hay alguna correlación entre Y y Z .
Tal vez incluso algo más simple. Respondamos a la pregunta "¿Qué tan bien miden nuestras reseñas la participación de las personas en nuestra empresa ?". Luego intente medirlo con Y - *número de personas que abandonaron la empresa durante los primeros 3/6/9/12 meses. Y dibuje el histograma dependiendo del grado de revisión Z.
Entonces, ¿hay alguna investigación científica sobre la efectividad de las entrevistas de pizarra? Hay un problema difícil de medir la efectividad de la persona, pero cualquier cosa con números reales, estadísticas y conclusiones sería genial.
¿Cómo se mide la eficacia de una entrevista?
Sé que mencionó la dificultad de la efectividad de la evaluación, pero aún hace la misma pregunta, lo que parece extraño. Si no puede evaluarlo objetivamente, entonces no puede responder esa pregunta de manera concluyente.
Tal vez alguna gran empresa calculó la verdadera tasa positiva de personas, que pasaron la entrevista de pizarra con éxito y realmente hicieron un gran trabajo.
La suposición de que esta es una métrica correcta es exactamente la misma suposición errónea que lleva a pensar que las entrevistas de pizarra son un buen marcador de aptitud.
El problema no radica en contratar a personas que pasen la entrevista de pizarra (y que puedan o no ser apropiadas para el puesto de trabajo). El problema radica en no contratar a personas que sean apropiadas para el puesto de trabajo, sino que simplemente no pasan una prueba que no evalúa su aptitud relevante.
Piénsalo de esta manera:
Un entrevistador se niega a contratar a alguien que haya pasado menos de cinco años en la universidad. El objetivo del entrevistador es claro: descartar a los solicitantes "no calificados", de modo que solo se evalúen los solicitantes "calificados". Sin embargo, su métrica (tiempo pasado en la universidad) es defectuosa.
Utilizo "calificado" y "no calificado" como un discriminador simplificado de la opinión del entrevistador sobre las habilidades necesarias para el puesto. No estoy tratando de etiquetar a la gente.
Esta es la razón por la cual la métrica es defectuosa: en realidad no separa a los "calificados" de los "no calificados". En realidad, no logra el objetivo que se implementa para lograr.
El problema con las entrevistas de pizarra es el mismo. Se utiliza para descartar a las personas que carecen de ciertas habilidades, pero prueba la métrica incorrecta y, por lo tanto, lleva a los entrevistadores a descartar a los solicitantes con la habilidad adecuada, así como a ofrecer puestos de trabajo a los solicitantes en función de la habilidad incorrecta .
Para resumirlo en una cita (que a menudo se atribuye erróneamente a Einstein):
Si juzgas a un pez por su habilidad para trepar a un árbol, vivirá toda su vida creyendo que es un estúpido.
El gran factor no mencionado aquí es lo que el entrevistador espera ver en la pizarra.
La razón principal parece ser que la gente piensa que el resultado de la entrevista de pizarra no se parece al entorno de trabajo.
Yo, por ejemplo, soy muy malo recordando la sintaxis de memoria. Sin embargo, soy muy rápido para buscar en Google temas relacionados, encontrar un fragmento de ejemplo y adaptarlo a mis necesidades. Sé que esto me hace sonar a mí mismo, pero puedo superar a la mayoría de los colegas en términos de velocidad para implementar algo desde cero.
Sin embargo, si me pone frente a una pizarra y me pide que escriba el código para deserializar un archivo XML, entonces ni siquiera sabría la clase utilizada para la (des) serialización.
Esto puede llevar a los entrevistadores a concluir que ni siquiera conozco los conceptos básicos y que mi repertorio de codificación es demasiado pequeño; mientras que lo contrario también puede ser cierto: mi repertorio de codificación es demasiado grande para recordar toda la sintaxis de memoria, y sé más que solo los conceptos básicos hasta el punto de simplemente no centrarme en los conceptos básicos.
Esta es la razón por la que "no parecerse al entorno de trabajo" anula el valor del ejercicio de pizarra. No todos funcionan de la misma manera. Recitar el conocimiento de memoria no es la métrica principal con la que se mide la aptitud de un desarrollador. Y ese es el quid de por qué la entrevista de pizarra no es un buen enfoque.
En todo caso, debería medir la capacidad de un desarrollador para adaptarse a nuevos sistemas y comprender el código existente, ya que esa es una habilidad mucho más valiosa.
Una vez me dieron este tipo de entrevista. Habían impreso su DbContext
implementación derivada y me pidieron que señalara lo que implementaron. Estaban buscando respuestas como eliminación suave, paginación, campos de auditoría, seguimiento de cambios. También habían introducido dos errores. Mi capacidad para evaluar el código existente es mucho más significativa que poder crear mi propia clase de la nada.
En segundo lugar, deja la puerta abierta a una falacia de inversión lógica.
Supongamos que el entrevistador le pide que recite de memoria todos los métodos de Entity Framework, ordenados por la longitud del nombre del método (sé que es un ejemplo tonto, pero quiero usar un ejemplo en el que no nos distraigamos discutiendo cuál es el mejor la respuesta es).
Si el solicitante puede hacer esto, entonces es una prueba (indirecta) de que debe tener mucha experiencia con Entity Framework. Sin la experiencia de Entity Framework, no podría hacer eso.
Sin embargo, es probable que el entrevistador invierta erróneamente esa lógica. Si la aplicación no puede hacer esto, eso no significa que no tenga experiencia con Entity Framework. Esta inversión es una falacia lógica.
Es por eso que estas preguntas son malas. Cuando el solicitante se enfrenta a una pregunta como esta, se encuentra entre la espada y la pared:
Independientemente de si el entrevistador cae en la trampa de la falacia o no, la existencia de la pregunta siempre coloca al solicitante en una posición incómoda de tener que evaluar el conocimiento del entrevistador (sobre la falacia) antes de que pueda dar una respuesta adecuada. Eso es efectivamente una apuesta , y realmente no deberías (no) contratar personas en base a (no) haber adivinado correctamente.
If I understood you correctly - you say, that if something is difficult to measure - it is not worth to measure it at all.
Eso no es lo que estoy diciendo. Lo que digo es que es imposible atribuir el éxito de una entrevista a una sola causa. Está tratando de usar métricas aproximadas que no son lo suficientemente precisas para darle una respuesta significativa (que es similar a la falla con las entrevistas de pizarra: métricas sobregeneralizadas que no tocan el enfoque central). Esto también es completamente diferente de las revisiones de desempeño o la contribución de calificación.Sorry, I don't like your answer, because it doesn't answer my question.
Responde a su pregunta, la respuesta simplemente no es lo que espera. Si está preguntando si algo existe y también excluye la posibilidad de que no exista, entonces su pregunta es discutible. No puedo probar una negativa (la ausencia de la existencia de investigación). Si desea afirmar que existe investigación, entonces usted tiene la responsabilidad de probar su punto.You're trying to use approximate metrics that are not precise enough to give you
, sí, para concluir esto necesita investigación, métricas y su precisión. Básicamente es lo que pido. De todos modos, he editado mi respuesta, lo que probablemente lo aclare. Gracias por tus comentarios.
Hombre enmascarado
DoctorMoisha
Adriano Repetti
gordito
erupción solar
más plano
más plano
I just would like to see whether negative experience of developers backed-up scientifically.
Me cuesta entender cómo se puede probar esto científicamente. Probar científicamente algo inherentemente significa que es objetivamente medible. La "experiencia negativa de los desarrolladores" es inherentemente subjetiva, por definición de la palabra "experiencia" en este contexto. En el mejor de los casos, puede encuestar para obtener opiniones. E incluso si todas las opiniones encuestadas están unánimemente de acuerdo, todavía no has probado nada.más plano
Maybe X could be person's effectiveness, which is really hard to measure, but big companies still try to do it with performance reviews.
No puede comparar entrevistas de pizarra con evaluaciones de desempeño. Las entrevistas de pizarra evalúan las habilidades fuera de un entorno de trabajo natural, en una escala de tiempo de 10 a 20. Las revisiones de desempeño evalúan la habilidad en un entorno de trabajo natural, generalmente en una escala de tiempo anual . La diferencia entre estos dos es la razón clave por la cual las entrevistas de pizarra se consideran inútiles para evaluar la habilidad del desarrollador.más plano
Let's say Y is the average of first three review grades. And Z will be average of reviewers grades. Is there any correlation between Y and Z.
¿No acaba de definir la correlación como Z siendo el promedio de Y?más plano
Maybe even something simpler. Let's answer question "How well do our reviews measure person's involvement in our company?"
¿Cómo se mide la participación? Eso es notoriamente difícil de medir objetivamente . Si ayudo a mi colega a entender algo, ¿se me acredita el trabajo que hace en función de su comprensión ahora mejorada? ¿Qué proporción de crédito obtengo? ¿Cómo se rastrea eso? ¿Un error en el análisis inicial, que provocó una reelaboración importante, se descuenta de mi contribución? Sigues tratando de usar métricas imperfectas y vagas, lo que anula el propósito de tratar de encontrar un resultado preciso .más plano
DoctorMoisha
Myles
DoctorMoisha
más plano
Many companies have standards on interview processes.
Tener un cierto estándar de ninguna manera hace que el resultado sea significativamente medible. El hecho de que las empresas tengan sus propios estándares sugiere fuertemente que no existe una medida objetiva de lo que es objetivamente mejor.So, it wouldn't be so hard inside one company.
Todavía te falta el punto de que es imposible atribuir correctamente la contratación de alguien (o no) a causas particulares, como la prueba de la pizarra. Las entrevistas son evaluaciones inherentemente multifacéticas y subjetivas.