¿Cómo probamos la confiabilidad y la calidad para minimizar el riesgo de falla de la placa en el campo?

Estamos desarrollando un cable inteligente para un cliente. El mercado potencial es de cientos de miles de unidades. El proveedor que diseña y suministra las placas (con firmware) que se integrarán en los cables está haciendo prototipos ahora. Podemos probarlos fácilmente para verificar su funcionalidad correcta, pero en cuanto a la confiabilidad y la calidad a largo plazo, no estoy seguro de cuál es la mejor manera de reducir el riesgo de fallas de campo sistémicas o de alta incidencia, que en esas cantidades sería un escenario de pesadilla absoluta para una pequeña empresa como la nuestra. ¿Cómo probamos prototipos y muestras de primeros artículos de producción en masa para minimizar al máximo el riesgo de confiabilidad y calidad?

Leí algo en un texto antiguo de electrónica que se quedó: "el calor es el enemigo número uno de los componentes electrónicos". Entonces, una parte importante de la cobertura de la prueba es operar las placas en un ambiente calentado, en el extremo de su rango operativo diseñado/documentado y algo más.
No opere ningún componente cerca del límite de su área segura: corriente, voltaje, disipación de energía, temperatura. Tenga en cuenta los extremos más amplios en la varianza entre los componentes. Por ejemplo, si se debe saturar un transistor bipolar, no asuma que tiene β de 100. Suministre una corriente base que sea un 1/10 sólido de la corriente de saturación.
Pruebe el hardware con corriente escamosa. El manejo de encendido-reinicio y pérdida de energía en el microprocesador debe ser completamente robusto para que el sistema se active cada vez y se reinicie de manera confiable en caso de pérdida de energía o apagones. Un sistema que funciona con una fuente de alimentación de laboratorio perfecta podría mostrar fallas en entornos con poca energía.
Además de estresarse con el calor, existen otras molestias. Humedad, vibración, impacto, polvo...
@Kaz: ¿por qué no pones todos esos comentarios en una respuesta? ¡Realmente deberías hacerlo!

Respuestas (5)

Hay varias maneras diferentes de abordar este problema. Por lo general, se realizan pruebas en las que el dispositivo funciona en condiciones estresantes para reducir su vida útil. Esto puede incluir temperatura elevada, ciclos de temperatura, vibración, humedad, etc. A veces, el protocolo de prueba falla. La falla puede repararse y la prueba puede reanudarse hasta la siguiente falla, etc. A menudo, se procesan muchas muestras al mismo tiempo.

Para obtener más información, consulte: http://en.wikipedia.org/wiki/Highly_accelerated_life_test

Hay muchas empresas que se especializan en este tipo de servicio de pruebas. Le sugiero que se ponga en contacto con uno de ellos.

Nuestros muchachos insisten en probar hasta fallar para que puedan hacer un análisis de weibull adecuado, que es mucho más informativo para conocer la vida útil esperada de su producto.

El primer paso es el sentido común. ¿Parece un diseño robusto? ¿Existen puntos de tensión mecánica evidentes? ¿Hay un alivio de tensión adecuado dondequiera que algo se flexione? ¿Se cumplen cuidadosamente todos los límites de la hoja de datos en todos los rincones posibles del funcionamiento normal con un margen razonable? ¿El diseño maneja el abuso esperado obvio? Esto es a la vez mecánico, como si alguien lo jalara o pisara cualquier parte, y eléctrico, como descargas electroestáticas. Consiga a alguien que haya hecho esto antes y tenga experiencia con lo que falla. En realidad, esto podría ser dos personas, una para mecánica y otra para electricidad.

Toma unos cuantos 10 de estas cosas y abusa de ellas. Realice algunas pruebas de estrés deliberadas con abuso mecánico, ciclos de temperatura y humedad, eliminación de ESD, etc. Algunas de estas estarán más allá de las especificaciones. El punto es que desea que un grupo falle para que pueda ver si hay una tendencia común de cómo fallan. Haga que esa parte sea más robusta, enjuague y repita.

También tienes que probar las cosas que no se te ocurrieron probar. Dé algunos a las personas con menos habilidades técnicas que conozca. Quiere gente que no sepa lo que se supone que no debe hacer con un cable. Deje que algunos niños de cuatro años jueguen con ellos y no intente decirles lo que no deben hacer ni limitar lo que hacen. Suponga que los niños de cuatro años son más imaginativos que usted. Puede decidir más tarde que saltar la cuerda con el cable o jugar tira y afloja con el perro a través de un charco de barro no son cosas de las que se va a proteger, pero de todos modos podría descubrir algunos mecanismos de falla interesantes. Y tal vez un perro que lo muerde no está tan fuera de lugar en comparación con él tirado en el suelo y siendo pisado regularmente. No espere que las personas traten su cable inteligente mejor que un cable de extensión. Si se'

Gracias por el aporte Olin! No me preocupan tanto los factores externos ya que la placa estará altamente protegida por el sobremoldeado Macromelt. Mi mayor preocupación son los factores intrínsecos relacionados con el uso a largo plazo y no estoy seguro de cómo simular eso (por ejemplo, calor constante durante un período prolongado para ver si falla algún componente). Por cierto, ¿cómo supiste que tengo un (próximamente) 4 años? :)

Lo que todos dijeron, más:

Tenga mucho cuidado al suponer que el encapsulado Macromelt compensará la construcción mecánica deficiente o las tensiones en el cableado, los conectores o las uniones.

Si diseña el resultado con Macromelt como parte del diseño e incluye el conocimiento formal y la consideración de sus características mecánicas y cambios a largo plazo en su entorno, entonces puede ser una parte legítima de su sistema. Si es solo "una capa protectora mágica que hace que todo esté bien", entonces puedes terminar con una bonita basura cubierta de plástico.


Usted menciona tableros incorporados que no hizo usted. Si estos no son accesibles, deben sobrevivir, pero incluso si son accesibles, le gustaría que sobrevivieran aunque no sea su responsabilidad. ¿Existe una protección de campo adecuada contra EMI, ESD, intrusión de humedad, ... ¿Cómo lo sabe? ¿Quien dijo? ¿Qué saben?

Además del FMEA de Jason] (http://en.wikipedia.org/wiki/Failure_mode_and_effects_analysis) y los niños de 4 años de Olin {quizás no estos} , puede probar algo fácil y potencialmente informativo al encontrar formas de matarlo automáticamente en formas que pueden no ser representativas del uso en el mundo real pero pueden invocar fallas útiles. por ejemplo, poner uno en una secadora durante unas horas. O días. Pasa bien? Pruébalo en caliente. Encuentre una manera de moverlo de un lado a otro continuamente para que el cable a los conectores esté estresado. Algo similar a la acción de un limpiaparabrisas, pero es probable que haya algo preconstruido que se pueda usar. Unos cuantos ciclos de lavadora suenan divertidos. ¿Debería sobrevivir a eso? ¿Habría que hacerlo? ¿Por qué no? ¿Tienes una hormigonera? :-)

¿Hay una batería de respaldo incorporada para 'descargarse'? ¿Está soldado en su lugar o en un soporte de batería? ¿Qué tan fuerte necesita golpearlo, estresarlo, tirar de él para que la batería pierda el contacto de forma permanente o instantánea? ¿Qué pasa con cualquier otra cosa dentro del 'cable'?

¿Hay un anunciador piezoeléctrico? Si es así, ¿puede tocarlo o aplicarle un golpe mecánico agudo? Si puede, ¿qué tan grande es el transitorio de voltaje generado y qué hace? (El equipo ha muerto cuando las personas aplicaron fuerza a una carcasa y tensaron mecánicamente el piezoeléctrico que causó sobretensiones.

¿La temperatura interna es más alta que la ambiente o está bien ventilada? Si está ventilado, ¿cómo se mantienen fuera el agua, las hormigas, las arañas, ...? Si está sellado, ¿utiliza condensadores electrolíticos de aluminio y cuál es la vida útil del diseño (observando que un Al ecap sin potencia dura menos a una temperatura determinada cuando está apagado que cuando está encendido).

¿Se congelará o se calentará a> 60C? ¿Quién dice que no? ¿Qué saben? ¿Alguna consecuencia?

¿Se puede conectar un enchufe al revés? ¿Quien dice? ¿Qué pasa si te esfuerzas mucho? (He visto conectores DB9 insertados 180 grados girados !!!!!!!!).

¿Está involucrada la alimentación de red? ¿Puede alimentarlo desde la red eléctrica incorrecta (alta o baja)? ¿Lo que pasa?

¿Tiene una fuente de alimentación externa? ¿Se puede usar el incorrecto? ¿Lo que pasa? Si se usa el correcto, ¿puede fallar? Si no puede fallar y hace ¿qué pasa?

¿Es compatible con ROHS? ¿Importa esto? ¿Por qué pensaste que no?

¿Necesita certificación EMC? ¿Quien dice?

¿Puede el niño de 4 años tragarlo por error :-)? O, más relevante, alguna pequeña parte desmontable de la misma.

¿Puede tener bajo voltaje en los pines del conector expuestos? Si estos están mojados o húmedos, pueden destruir el conector o el dispositivo debido a la electrólisis. (En el peor de los casos, la electrólisis puede destruir un conector en minutos).

Todo lo anterior se traduce en: ¿Ha mantenido al día los pagos de protección de Murphy? :-).

¿Hay un camino desde el metal táctil hasta el interior que lo hace propenso a la "electricidad estática"? Esto está cubierto anteriormente por las pruebas ESD formales, pero ser consciente de los medios generales para hacer que la ESD sea menos (o más) propensa a causar daños puede ayudar.

¿Sobrevivirá siendo TASERed? No debería haber necesidad, pero ¿lo hará? (Me han dicho que es una forma preferida de poner fuera de servicio los sistemas de cámaras de seguridad en algunos países).

La respuesta simple es diseñar para el fracaso y luego prevenirlo.

Busque cálculos de FMEA, MTBF y confiabilidad. Existe un software comercial que lo ayuda con esto (Relex es uno que puedo recordar), pero se puede hacer en una hoja de cálculo con bastante facilidad, aunque es una tarea tediosa.

Existe una gran cantidad de documentos de especificaciones militares (p. ej., MIL-HDBK-217) y de aviónica que abordan el tema de la confiabilidad. Básicamente, tiene en cuenta cada componente, su uso, su estrés, sus clasificaciones, ubicación y proceso utilizado para soldarlo, luego, al buscar en las tablas (en las especificaciones militares) y los datos del fabricante, se obtiene una cifra para su MTBF. A menudo, esto implica averiguar con el fabricante cómo se fabrica.

Considere cada propiedad física, por ejemplo, voltaje, corriente, temperatura (dentro y fuera de servicio), vibración, potencia, ciclo de trabajo, choque mecánico, etc.

Una vez que conoce el MTBF de cada componente, puede calcular cuándo fallará una unidad (en promedio). Eso se tiene en cuenta en la vida útil y el soporte de por vida del producto.

Por ejemplo, generalmente intenta reducir el estrés en los componentes, sobrevalorándolos para compensar. Por ejemplo, para un condensador que tiene 5 V durante toda su vida útil, puede elegir una parte de 50 V en lugar de una parte de 10 V.

FMEA considera lo que sucederá cuando falle cada componente. Por lo general, solo considera un único punto de falla. Para cada componente (nuevamente en una hoja de cálculo) decida qué sucederá con el rendimiento de ese producto si:
Se sale de la tolerancia
Se produce un cortocircuito
Se abren los circuitos

Para dispositivos de varios pines, considere cada pin por separado.

Use algo de sentido común para decidir cuál podría ser el corto y documente esa decisión.

En alta confiabilidad (por ejemplo, centrales nucleares) tienen que tener más cuidado para considerar (o mitigar) cortos aparentemente imposibles.

Una vez que haya hecho lo anterior, le dará información para retroalimentar el diseño y realizar cambios que lo mejorarán para reducir el riesgo de fallas, luego lo hará todo de nuevo...

prueba de caída

Además de las muchas buenas sugerencias aquí, podría considerar una prueba de caída.

Una prueba de caída estándar implica "una prueba de caída sobre cada cara, borde y esquina, un total de 26 veces sobre una superficie de hormigón cubierta de madera contrachapada". (Para más detalles, consulte el estándar militar MIL-STD-810G , MÉTODO 516.6, Procedimiento IV - Caída en tránsito). Algunas empresas de pruebas independientes parecen preferir dejar caer directamente sobre el hormigón desnudo.

Escuché rumores de que las pruebas de caída de 3 metros son populares para los teléfonos celulares de consumo. a b c d

Algunas compañías de prueba independientes parecen preferir "probar hasta la destrucción", aumentando gradualmente la altura de caída hasta que algo falla. Exactamente qué falla y cómo es información valiosa; a menudo, esa información le permite ajustar el diseño para hacerlo significativamente más resistente con un costo de fabricación adicional mínimo o nulo.