¿Cuáles son los mecanismos de falla en un circuito integrado?

Contexto

Siempre he tratado de diseñar mis circuitos para que los chips estén dentro de sus clasificaciones máximas absolutas. Sin embargo, comprender los mecanismos de falla es vital para poder depurar un chip cuando algo sale mal (generalmente termino intentando con otro chip, lo que cuesta tiempo).

Pregunta

De ahí mi pregunta: ¿cuáles son los mecanismos de falla más comunes debido al uso incorrecto (es decir, voltajes y corrientes de entrada/salida) de los circuitos integrados? Los detalles y los diagramas son una gran ventaja para esta pregunta compleja, la respuesta ideal vincularía las familias más comunes de entradas/salidas (CMOS, etc.) y los malos usos (voltaje inverso, sobrecorriente...) con efectos de falla.

Ejemplo

Esta es una pregunta general, pero lo que la desencadenó es que, para proteger contra los voltajes de entrada negativos de un dispositivo con alimentación asimétrica, parece que las resistencias limitadoras de corriente son suficientes (antes tenía schottkies paralelos). ¿Eso significa que no existe tal cosa como una falla de voltaje, cada falla está relacionada con la corriente (hasta cierto punto)? ¿Cómo exactamente?

Hay tantos modos de falla interesantes para los dispositivos eléctricos: en.wikipedia.org/wiki/Electromigration es solo uno de ellos.

Respuestas (3)

Dos modos inmediatos de falla son la sobretensión y la sobrecorriente.

  1. Si tiene una entrada de alta impedancia como una puerta a un mosfet, entonces el alto voltaje (incluso con una corriente muy baja) causará una perforación en la puerta capacitiva del mosfet ya que los electrones tienen suficiente energía para causar la ruptura del dieléctrico. Una vez que esto ocurre, la resistencia de la entrada cae casi a cero y una corriente alta de bajo voltaje posterior calentará aún más y destruirá el mosfet. Este modo de falla es la razón por la que hay protección ESD en muchos chips.
  2. La sobrecorriente provoca el sobrecalentamiento del dispositivo. Una vez que las temperaturas sean lo suficientemente altas como para comenzar a cambiar la estructura y/o quemar los semiconductores internos, comenzará a actuar de manera extraña, funcionará de manera menos eficiente o fallará por completo como un circuito abierto o corto.

Es posible que pueda pensar en el voltaje inverso como otro mecanismo de falla, pero en general eso aún cae dentro de una de las otras dos categorías, es diferente pensar en ello. Por ejemplo, si alguien invierte una fuente de alimentación en un circuito con un diodo, es posible que no espere corriente a través del diodo y, en cambio, obtenga una condición de sobrecorriente porque el diodo ahora estaría polarizado hacia adelante.

Tenga en cuenta que es probable que los condensadores, resistencias e inductores (y cualquier otro elemento del circuito) se dañen de manera similar a los circuitos integrados de transistores, es decir, sobrecorriente y/o sobretensión.

Otros modos de falla de la electrónica en general se pueden encontrar aquí: http://en.wikipedia.org/wiki/Failure_modes_of_electronics

Además (ya menudo se pasa por alto) operar fuera de los rangos de temperatura especificados da como resultado un rendimiento indefinido, posiblemente falla.
Gracias por explicar esto. Siempre pensé en las sobrecorrientes como la causa de las fallas por sobrecalentamiento (derretimiento de la unión) en lugar de al revés. Entonces, para proteger contra el voltaje inverso, ¿es suficiente una resistencia en serie simple para proteger el chip (incluso si no funciona de esa manera)?
@MisterMystère Tiene más razón en general, la sobrecorriente provoca un sobrecalentamiento. Editaré mi respuesta para que quede más claro. Puede calentar externamente un chip para que falle, pero ese no suele ser el modo de falla. Para evitar el voltaje inverso, se puede usar un diodo de caída de voltaje de avance bajo. Es probable que una resistencia haga que el circuito actúe de manera diferente a lo esperado.

Respuesta corta: la temperatura es el mayor problema en un circuito diseñado correctamente.

Esta es una pregunta bastante amplia con todo un campo de la ingeniería. Se pueden encontrar algunas referencias útiles navegando por las especificaciones de JEDEC (gratis). JEDEC es un organismo de estándares que ayuda a mejorar la calidad en toda la industria de los semiconductores. Prácticamente todas las empresas siguen los criterios de calificación de JEDEC para evitar que los defectos latentes, de fábrica o sistemáticos lleguen al campo.

Volviendo a su pregunta, algunos mecanismos de falla primarios de IC que he observado o trabajado con la fábrica para mejorar:

  1. Integridad del óxido de la puerta MOS: El óxido contaminado puede alterar el VT, la temperatura o el voltaje puede causar una ruta de conducción a través del óxido (perforación). Por lo general, se pone mucha atención aquí durante las calificaciones del dispositivo.
    • Temperatura: este es el factor de aceleración n.° 1 en el modelo de Arrhenius que describe la confiabilidad de los semiconductores. Si un IC diseñado para funcionar a una temperatura ambiente de 60 °C funciona realmente a una temperatura ambiente de 100 °C, la vida útil del dispositivo se acortará drásticamente (varios años).
    • Voltaje: ESD, transitorios de voltaje, etc. pueden debilitar el óxido. ESD generalmente se especifica y se controla bien en la fábrica. Los transitorios VGS a veces necesitan ser considerados en el diseño.
  2. Latchup: tiristor parásito activado por sobretensión o inyección de corriente. La mayoría de los dispositivos se especifican con algún nivel de inmunidad de bloqueo. Las resistencias de aislamiento y los diodos de abrazadera pueden ayudar a mitigar esto según el tipo de enganche.
    • Sobrevoltaje: tirar de un nodo de voltaje por encima de su riel de suministro positivo o por debajo de su riel de suministro negativo podría desencadenar un parásito que daña el dispositivo.
      • Su ejemplo de la resistencia de aislamiento suena como un evento de bloqueo esperando a suceder. Los diodos de abrazadera pueden ser más prudentes, especialmente si va a producir el diseño en masa.
    • Inyección de corriente: Los picos de corriente transitorios, especialmente en los pines IO, también pueden desencadenar el enganche.
    • Temperatura: por lo general, reduce la inmunidad de enganche.
  3. Ciclos de temperatura: La expansión y contracción debido a ciclos rápidos de encendido/apagado, dispositivos de alta corriente o voltaje, etc. pueden causar que las capas/conexiones internas y externas del dispositivo se desgasten.
    • Huecos/relleno: las capas internas de metal de los circuitos integrados pueden 'torcerse', provocando huecos (aberturas) o rellenos (cortos) entre capas, delaminación, etc. Obviamente, esto es lo mismo para las PCB.
  4. Temperatura/Presión/Humedad: Puede causar corrosión galvánica, incluso fallas en la memoria cuando la humedad penetra el empaque de plástico de los circuitos integrados más populares. Esto generalmente se mitiga a través de la selección de materiales y 'horneando' la humedad del dispositivo.
Gracias por tu extensa respuesta. Sin embargo, no entiendo completamente el cierre, ¿podría explicar más en aplicación a mi ejemplo (los esquemas anotados simples serían bienvenidos)?

Esta es una especie de pregunta tonta. Una respuesta completa llenaría un libro. En el contexto del diseño de una placa, la respuesta es irrelevante (lo explicaré más adelante). Pero sigue siendo una pregunta útil.

Siga la hoja de datos. Áreas especialmente notables, si el diseñador ha decidido decirle que NO aumente demasiado rápido el voltaje en el primer encendido, no sea creativo y decida que sabe mejor. Incluso si es una molestia diseñar una fuente de alimentación que aumente lentamente. La mayoría de las indicaciones dadas serán sutiles, si la hoja de datos es estridente, entonces realmente preste atención.

Hay muchos mecanismos de falla en los circuitos integrados, pero el impacto en el chip posteriormente requiere un conocimiento profundo del funcionamiento interno. Puede tener un transistor defectuoso y es posible que nunca se note o que se elimine todo el chip. Incluso el diseñador puede no saber, FMEA se realiza, pero generalmente solo en áreas clave (FMEA = Análisis de efectos de modo de falla).

Muchas de las restricciones en el chip son impuestas por el proceso. La fundición dicta las prácticas de diseño, ubicación, etc. y tienen un software que verifica las violaciones. Otras limitaciones son operativas y se traducen directamente en voltajes máximos, requisitos de disipación de calor, dV/dt en señales, etc.

Debido al mayor costo, la complejidad del diseño y los efectos colaterales de hacerlo mal (retrasos en el cronograma, etc.) en su mayor parte, la mayoría de los diseños de chips tendrán cubiertas la mayoría de las bases. Pero hay excepciones notables cuando el proceso falla.

Entonces, preguntar sobre los modos de falla del diseño del chip con respecto al diseño de la placa es como abrir el capó de su automóvil, quitar un perno al azar y preguntar "¿esto impedirá que el automóvil funcione?" si quita el tapón del cárter de aceite, sí. si es uno de varios pernos redundantes en las tapas de válvulas - no. Donde la verdadera respuesta es, "¡no quites tornillos!".

Para algunos diseños, el diseñador del chip a veces pondrá "te pillo" en el diseño que, si el diseñador de la placa es inteligente, hará que preste atención. Las mejores interacciones son cuando el chico del tablero dice "¿por qué pusiste esa señal en ese pin de allí? Estropea el bla, bla, etc." estos son casi siempre el comienzo de conversaciones maravillosas y, por lo general, una interacción y amistad de mucho tiempo. La respuesta suele ser "muy buena, sin embargo, este es el flujo de señal en el chip, y si lo hiciera de esa manera...", la respuesta siempre es un "Eureka".

Un IC no tendrá sobrecorriente a menos que lo haya dañado o lo esté operando fuera de sus especificaciones. Sobrecorriente = cosas malas que ya están sucediendo, lo cual solo tiene sentido. Un chip solo presentará una carga de cierto tamaño a una fuente de voltaje, esto significa una corriente fija. Decir que la sobrecorriente es lo que mata a los chips es como decir que una fuente de voltaje fijo que impulsa una resistencia fija podría fallar porque la resistencia podría pasar por encima de la corriente. La sobrecorriente es una falla/efecto, NO es una causa.

Interesante, gracias. Sin embargo, sé que debemos seguir las pautas de la hoja de datos (si no lo hubiera hecho, lo sabría con seguridad hoy), más bien pregunto qué sucede en general cuando las precauciones que tomamos salen mal (o si pasamos por alto una). Es para ciertos chips específicos, pero como escuché que muchas de las entradas / salidas de los chips son similares, tal vez se pueda explicar qué sucede cuando se aplican voltajes / corrientes incorrectos (por ejemplo, entrada CMOS, etc.)? He actualizado mi publicación para mostrar eso.