¿El enfriamiento de los chips NAND en un SSD afecta negativamente su confiabilidad?

El problema de la disipación de calor en SSD de factor de forma pequeño y alto rendimiento es bien conocido, por ejemplo, el artículo Análisis térmico transitorio para regulación térmica de SSD M.2 publicado en 2018 17th IEEE Intersociety Conference on Thermal and Thermomechanical Phenomena in Electronic Systems estados:

La tecnología de unidades de estado sólido (SSD) continúa avanzando hacia espacios más pequeños con mayor ancho de banda y la adopción de nuevas interfaces de E/S en el segmento de mercado de PC. Los requisitos de rendimiento de energía se están ajustando en el proceso de diseño para abordar requisitos específicos junto con el desarrollo de la tecnología SSD. Para cumplir con este requisito agresivo de rendimiento, un problema importante es el estrangulamiento térmico. A medida que las temperaturas de unión NAND y ASIC se acercan a sus límites operativos seguros, se activa la regulación del rendimiento y, por lo tanto, el consumo de energía disminuiría en consecuencia.

Naturalmente, si el espacio lo permite, agregar un disipador de calor enorme es una posible solución a este problema, hay muchos productos disponibles en el mercado de juegos de PC. También veo que muchos adaptadores pasivos de M.2 a PCI-E en el mercado tienen disipadores de calor incorporados al agregar un gran vertido de cobre con conexión al plano de tierra debajo del conector M.2.

Pero uno puede encontrar muchas publicaciones sin fuente en foros de hardware de computadora al azar, que afirman que los chips NAND nunca deben enfriarse. Se afirma que en realidad están diseñados para calentarse hasta una temperatura de funcionamiento óptima, y ​​agregar un disipador de calor a los chips NAND afecta negativamente su confiabilidad. Aquí hay algunos ejemplos.

Una afirmación dice,

¡No enfríes los troqueles NAND por sí mismos!

Se calientan a sí mismos hasta la temperatura de funcionamiento por diseño, enfriarlos significa que descargan continuamente energía tratando de alcanzar la temperatura, y funcionarán con una menor resistencia (simplificado: temperatura de funcionamiento más alta = menor entrada de energía para configurar/borrar celdas = menos degradación de cada celda por ciclo de escritura/borrado).

Otro reclamo dice,

Enfriar la NAND es malo. Desea que la NAND se caliente y se mantenga caliente. A medida que su temperatura fluctúa y se enfría, si de repente transfiere un archivo grande (leer o escribir, no lo recuerdo) mientras la NAND no ha tenido tiempo de calentarse primero, puede reducir significativamente la vida útil de entonces y.

No me suena bien. Sugiere que los chips NAND dependen del efecto de autocalentamiento para alcanzar una temperatura de funcionamiento óptima, que es algo que nunca antes había escuchado. Los únicos chips que conozco que usan autocalentamiento son las referencias de voltaje "Super Zener" LM199/299/399 de National y el convertidor térmico RMS-DC LT1088 de Linear Technology. Pero no creo que los chips NAND tengan nada que ver con el autocalentamiento.

Traté de verificar y/o desacreditar esta declaración, comenzando por buscar una hoja de datos de chip NAND que se encuentra en algunos SSD recientes. Fui a Digikey y Mouser, configuré el filtro en la densidad de almacenamiento más alta y los clasifiqué por precios. Desafortunadamente, parece que las hojas de datos no están disponibles (¿todas bajo NDA? ¿Estoy buscando en el lugar equivocado?).

¿Estas declaraciones extrañas tienen alguna base fáctica?

Cite la referencia del reclamo que publicó; agregue un hipervínculo.
anandtech.com/show/15182/… Es una contribución del usuario.

Respuestas (3)

El artículo Influencia de la temperatura de almacenamiento, operaciones de escritura y lectura en memorias flash NAND de celdas de nivel múltiple de 2018 muestra el siguiente gráfico, que sugiere que escribir en celdas flash a una temperatura de 25 °C o menos da como resultado problemas de lectura más tempranos en comparación con escritura a 85°C.

En su discusión deducen el siguiente razonamiento:

La mayoría de las memorias NAND Flash implementan el efecto túnel 1 de Fowler-Nordheim para inyectar cargas a través de la puerta flotante [7] durante la operación de escritura. Durante los ciclos de escritura, el circuito de programación controla la carga de las celdas para garantizar un margen suficiente de umbral de voltaje. Se supone que el circuito de gestión de la escritura probablemente se desvíe con las bajas temperaturas. De hecho, los parámetros del transistor (voltaje de umbral y ganancia) varían con la temperatura, lo que a su vez induce cambios en la corriente de drenaje.

Y en la conclusión resumen:

Las operaciones de escritura a bajas temperaturas conducen a una disminución en el tiempo de retención de datos, probablemente no debido a una degradación de la celda sino a desviaciones paramétricas de la electrónica integrada en la matriz dedicada a las operaciones de escritura.

Esto sugiere por qué el comentario citado en la pregunta podría decir eso.
Pero en la práctica , asumiría que este efecto no es relevante, porque un mejor enfriamiento del flash simplemente le dará al controlador de flash más espacio para un mayor rendimiento mientras mantiene la misma temperatura (suponiendo que se enfríe con un disipador de calor tradicional). Sin embargo , después de ver las medidas anteriores , NO enfriaría mi SSD con LN2.

ingrese la descripción de la imagen aquí
https://doi.org/10.1016/j.microrel.2018.06.088

¡Gracias por la publicacion! Es muy poco probable que agregar un vertido de cobre conectado al plano de tierra en un adaptador PCI-E enfríe un chip NAND a 25 ° C (ya sea la unión o la temperatura ambiente), diría que el caso está cerrado y son perfectamente seguros diseños
Ese es un hallazgo interesante allí. Muestra claramente que el efecto de la alta temperatura domina sobre el estrés inducido por escribir a temperaturas más bajas. Exactamente el papel que estaba buscando pero no encontré.

Primero, no creo (por ejemplo, no he encontrado) los chips flash se calentarán activamente. Simplemente se calientan cuando se usan como lo hará una CPU. Las mediciones de consumo de energía y temperatura de los SSD también parecen indicar esto (utilizarían bastante energía en reposo para mantenerse a la temperatura óptima).

Creo que el reclamo está mirando solo una cosa y no la imagen completa. Este artículo sobre EEWEB muestra dos cosas a considerar. Tasa de error de bit sin procesar (RBER) y retención de datos. Hay un aumento definitivo en el RBER con la disminución de la temperatura, pero al mismo tiempo la retención de datos disminuye significativamente con temperaturas más altas.

Probablemente hay diferentes modos de falla en el trabajo que contribuyen de manera diferente en diferentes temperaturas. Al ver que la retención de datos se reduce significativamente a temperaturas elevadas (por encima de 55 °C), intentaría mantenerlo relativamente fresco.

Los datos sugieren que no hay un efecto negativo en permanecer a temperatura ambiente donde la retención de datos sigue siendo mucho mejor que a temperaturas más altas.

Es sorprendentemente difícil encontrar algo sobre la retención y la resistencia a temperaturas inferiores a 25 °C.

¿Qué tan cierta es esta afirmación?

En mi opinión: esto es completamente falso .

Hasta donde sé, no existe una temperatura "óptima", la temperatura más alta a la que funcionarán los chips está limitada por el control de temperatura en el chip. Los chips se ralentizan cuando se alcanza la temperatura máxima de funcionamiento. Disminuir la velocidad significa menos consumo de energía, por lo tanto, menos generación de calor, por lo que la temperatura de los chips se estabilizará en un valor máximo controlado por el chip.

Cuando se conecta un disipador de calor, se puede disipar más energía en los chips mientras están a la misma temperatura. Un disipador de calor ayudará a eliminar el calor de los chips. A medida que se puede disipar más energía, los chips pueden funcionar a mayor velocidad.

mayor temperatura de funcionamiento = menor consumo de energía para configurar/borrar celdas = menor degradación de cada celda por ciclo de escritura/borrado

Dudo que la cantidad de energía necesaria para escribir en una celda dependa tanto de la temperatura. Además, esto parece estar relacionado solo con escribir en celdas y no leer. Se ha demostrado que enfriar un SSD aumenta su rendimiento de lectura.

El escritor del artículo (debe incluir un enlace donde lo desee) no parece entender muy bien cómo funciona la memoria flash.

Tu opinión personal no importa en absoluto y es terriblemente incorrecta. Estás mezclando lo que hacen el controlador y las NAND reales. Si hubieras leído el periódico, sabrías que tu última frase también está mal. ¿Estás llenando tu falta de conocimiento con "opiniones" y luego incluso te atreves a desacreditar a la op?