¿Cómo va a morir el flash NAND cuando se sobrecalienta?

Si tengo un flash NAND que tiene una clasificación de 70 °C, ¿qué va a pasar con ese flash NAND cuando lo caliente a 80 °C o 100 °C?

Estoy pensando en un escenario en el que la muestra nominal de 70 °C en realidad comienza a producir errores a 71 °C y no estoy viendo una muestra que no tendrá problemas por encima de los 100 °C.

Mis suposiciones actuales son que la lógica puede estar dañada (como en la RAM y la CPU) o los bits NAND reales pueden cambiar con más frecuencia.

Básicamente, estoy tratando de encontrar una metodología de prueba de alto nivel que pueda ejecutarse desde Linux.

¡Gracias!

¿Una puerta NAND? ¿O un flash NAND?
En pocas palabras, ninguno de los números enumerados en la hoja de datos puede garantizarse. Los errores pueden variar desde algo tan sutil como un aumento en el umbral de Vlow hasta que la salida nunca cambie.
@IgnacioVazquez-Abrams Flash NAND.

Respuestas (2)

Algunas cosas en las que puedo pensar.

  • Posibilidad de que se borre la memoria (mala retención de datos). En la memoria flash, la carga almacenada en la puerta aislante de un MOSFET actúa como elemento de memoria. A altas temperaturas, esta carga se filtra más rápidamente. De ti paper : "con suficiente activación térmica, todos los bits podrían perder su carga". También del mismo papel, daños por óxido de puerta.
  • Se acumularán cargas atrapadas inyectadas en el óxido debido a la alta temperatura. Con el tiempo, esto se sumará y creará una compensación de voltaje en la puerta (lo que hará que el FET tenga más fugas). Esto podría crear una situación en la que el FET esté permanentemente encendido (a menos que la compuerta esté lo suficientemente baja) si se acumula suficiente carga.
  • Menor vida útil en general. El calor hace que muchos procesos se aceleren exponencialmente: ( Ley de Arrhenius ). La expansión térmica puede provocar el desprendimiento de las vías de metal de sus respectivas capas o una serie de otros problemas.
  • Posible falla completa debido a un escape térmico (irrecuperable).
  • Mayor fuga en general. Más energía quemada. Del pdf sobre fugas , en proceso de 65 nm: la fuga a 0C es ~10x menos que 40C, que es ~10x menos que 100C.
  • El circuito correrá más lento de lo esperado, debido a más colisiones de transportistas gratuitos.

No verá nada porque están enmascarados por la parte delantera. Cuando obtiene errores de bit, simplemente salta a una nueva página. Solo notará que el dispositivo se vuelve más pequeño, más rápido.

Si pudiera verlos, la falla que probablemente verá son errores leves debido al ruido, pero es diferente de lo que piensa. A medida que aumenta la temperatura, las densidades de los estados se expanden y los umbrales se mueven debido al intercambio de carga del lado del drenaje que acorta la longitud efectiva del canal. Esto causa problemas en los sistemas sincronizados que dan errores de lectura, pero esto no se debe a los transistores FLASH, sino a los amplificadores de carga.

Hay otros dos escenarios que vienen a la mente para los errores graves.

1) Obtiene más carga "atascada" en el óxido durante la inyección debido a estos niveles de energía aumentados que generalmente no atraparían la carga. Mi respuesta sobre la simulación de puertas flotantes tiene un diagrama de banda para esta inyección, e imagine que el electrón queda atrapado en la barrera. (una nota, este es el comportamiento que hace que las cosas fallen después de millones de escrituras. Aumentar la temperatura solo acelera el proceso)

2) La energía adicional debido al calor hará que un agujero obtenga suficiente energía para "saltar" a través del óxido. Esto hace un cráter literal en el óxido. Podría crear este comportamiento en el laboratorio, pero tenía control de puerta del dispositivo real y una cámara de temperatura.

Su primer párrafo es incorrecto en muchas situaciones. Si usted es el desarrollador de la capa de traducción flash, verá todos los errores y es su trabajo mapearlos. Incluso si está utilizando una NAND con ECC incorporado, el usuario es responsable de la nivelación del desgaste y el mapeo de bloques defectuosos. La declaración que hizo solo es cierta para dispositivos de tipo SD y NAND administrados, o si está trabajando en software por encima de la capa de traducción flash.
@rjp Buenos puntos, pero al usar Linux o algo en lo que tiene una capa de abstracción, no hay forma de ver lo que sucede en el dispositivo, así que escribí desde el punto de vista de lo que se puede ver.