IT
February 11

куда пропадают данные..

отвечаю

Айтишная молва гласит, что данные, которые хорошо себя вели, уходят в данновый рай, где их часто читают, оптимизируют, исправляют ошибки, в общем, холят и лелеят. А данные, которые плохо себя вели, попадают в данновый ад, где их постоянно затирают всякой непотребщиной, восстанавливают и опять затирают, причём в извращенной форме.


На изображении показана таблица от организации
JEDEC с требованиями к классам надёжности SSD (SSD endurance classes and requirements).

JEDEC — это международная организация, которая устанавливает стандарты для микросхем памяти (в том числе NAND и SSD). Производители ориентируются на эти требования при проектировании накопителей.

Столбцы таблицы:

  • Application Class (Класс применения): Client — потребительские SSD а Enterprise — серверные SSD
  • Workload (Тип нагрузки) - Client — обычная пользовательская нагрузка а Enterprise — интенсивная серверная нагрузка
  • Active Use (power on) - Условия, когда накопитель включён и работает: потребительские 40 градусов - 8 часов в день, серверные 55 градусов - 24 часа в день
  • Retention Use (power off) - Сколько времени SSD должен хранить данные без питания: потребительские 30 градусов - 1 год, серверные 40 градусов - 3 месяца

SSD хранит данные в ячейках NAND-памяти как электрический заряд в изолированном затворе транзистора.

Проблема:

  • Заряд постепенно «утекает»
  • Чем больше износ (P/E циклов), тем сильнее деградация изоляции
  • При повышенной температуре утечка ускоряется

Со временем контроллер уже не может корректно определить 0 это или 1.


В сухом остатке имеем для SSD такую картину: каждые +10°C примерно удваивают скорость деградации, 3 месяца при 40°C ≈ примерно сопоставимо с более длительным сроком при 30°C

Физика утечки заряда в NAND-памяти

Базовая структура ячейки NAND

Классическая NAND-ячейка — это МОП-транзистор с плавающим затвором (Floating Gate MOSFET).

Структура (снизу вверх):

  1. Кремниевая подложка (канал)
  2. Тонкий туннельный оксид (SiO₂, порядка 7–10 нм)
  3. Плавающий затвор (изолированный поликремний)
  4. Межзатворный диэлектрик
  5. Управляющий затвор

Плавающий затвор полностью изолирован диэлектриком. Если туда «закачать» электроны, они не имеют прямого проводящего пути наружу.

Заряд на плавающем затворе изменяет пороговое напряжение транзистора (Vt). Контроллер измеряет Vt и определяет, какое логическое состояние записано.

Как происходит запись

Запись (program) выполняется методом Fowler–Nordheim tunneling.

Суть:

  • Между каналом и плавающим затвором создаётся сильное электрическое поле (порядка 10 МВ/см).
  • Электроны «туннелируют» через тонкий оксид.
  • Они накапливаются в плавающем затворе.

Стирание (erase) — обратный процесс: поле меняется, и электроны туннелируют обратно.

Что такое хранение данных

Данные хранятся в виде количества заряда на плавающем затворе.

В SLC:

  • 2 состояния (есть заряд / нет заряда)

В MLC / TLC / QLC:

  • 4 / 8 / 16 уровней заряда
  • различаются малыми изменениями порогового напряжения

Чем больше уровней, тем меньше допустимое «окно» по напряжению.

Почему заряд утекает

Хотя плавающий затвор изолирован, оксид не идеален.

Существуют механизмы утечки:

Туннелирование через дефекты:

После многократных циклов program/erase в туннельном оксиде появляются:

  • ловушки заряда (trap states)
  • микродефекты
  • локальные области истончения

Через них электроны могут медленно туннелировать обратно.

Это основной механизм деградации retention.

Trap-assisted tunneling (TAT):

Электрон не туннелирует напрямую через весь оксид, а «перепрыгивает» через цепочку дефектов.

С увеличением числа P/E циклов количество ловушек растёт.

Термически активируемая эмиссия:

При повышении температуры:

  • электроны получают больше энергии
  • возрастает вероятность покинуть ловушку
  • ускоряется утечка

Правило приближённой оценки:
Каждые +10°C примерно удваивают скорость деградации.

Статистическое перераспределение заряда:

Заряд может перераспределяться внутри плавающего затвора, создавая локальные изменения поля.

Что происходит при износе (P/E циклы)

Каждый цикл program/erase:

  • создаёт высокое электрическое поле
  • разрушает часть туннельного оксида
  • увеличивает плотность ловушек

После тысяч циклов:

  • оксид становится «дырявым» на нанометровом уровне
  • растёт ток утечки
  • окно по Vt сужается

Это напрямую ухудшает retention.

Почему QLC хуже хранит данные

LC хранит 16 уровней напряжения.

Если представить диапазон пороговых напряжений как шкалу:

SLC:
| 0 | 1 |

QLC:
| 0 | 1 | 2 | ... | 15 |

Разница между соседними уровнями мала.

Даже небольшая утечка:

  • смещает Vt
  • вызывает пересечение порога
  • приводит к ошибке чтения

Поэтому у QLC:

  • ниже допустимое число P/E циклов
  • выше чувствительность к температуре
  • хуже retention в конце ресурса

Физика утечки заряда в NAND — это сочетание:

  • квантового туннелирования
  • деградации оксида
  • термически активируемых процессов
  • статистического распределения дефектов

Чем выше:

  • температура
  • плотность хранения (TLC/QLC)
  • количество P/E циклов

Тем быстрее происходит потеря заряда и тем хуже retention.


Теперь сравним это с классическими жёсткими дисками (HDD) и посмотрим, как они ведут себя на фоне физики утечки заряда в NAND.


1. Принцип хранения данных в HDD

В отличие от SSD, где данные — это электрический заряд, в HDD данные хранятся как магнитная ориентация доменов на поверхности пластины.

Каждый бит — это участок ферромагнитного материала, намагниченный в одном из направлений.

Никакого заряда нет. Никакого туннельного оксида нет. Нечему «утекать» в электрическом смысле.


2. Есть ли у HDD аналог retention

Да, но природа другая.

В HDD возможны:

  • магнитная релаксация
  • термическая дестабилизация доменов
  • деградация поверхности
  • механические проблемы

Но данные не исчезают из-за «утечки» как в NAND и это выглядит так:

Если диск просто лежит без питания:

  • магнитная ориентация сохраняется годами
  • при нормальной температуре изменения крайне медленные

3. Магнитная стабильность (Superparamagnetic limit)

С уменьшением размеров битов в HDD возникла проблема:

Если магнитный домен слишком мал, тепловая энергия может случайно изменить его ориентацию.

Это называется суперпарамагнитным пределом.

Современные HDD решают это:

  • использованием материалов с высокой коэрцитивностью
  • технологиями PMR, SMR
  • HAMR (нагрев при записи)

В нормальных условиях хранения данные стабильны 5–12+ лет.


4. Что происходит при хранении без питания

SSD

  • деградация идёт постоянно
  • скорость зависит от температуры
  • особенно быстро в конце ресурса

HDD

  • магнитные домены стабильны
  • деградация очень медленная
  • чаще проблемы механические, а не магнитные

5. Реальные риски для HDD при длительном хранении:

Залипание головок (stiction):

Если диск долго не вращается:

  • смазка может деградировать
  • головки могут «прилипнуть» к поверхности
  • мотор может не раскрутиться

Это механическая проблема, не потеря данных.

Размагничивание:

Очень медленный процесс.

При комнатной температуре вероятность самопроизвольной смены ориентации крайне мала.

Для заметной деградации нужны:

  • десятки и демятки лет
  • высокая температура
  • сильные внешние магнитные поля

Corrosion / деградация покрытия:

Если хранить во влажной среде:

  • может пострадать защитное покрытие
  • возможно появление ошибок чтения

Итоговая картина

Физика SSD:

  • квантовое туннелирование
  • деградация оксида
  • экспоненциальная зависимость от температуры

Физика HDD:

  • стабильные магнитные домены
  • механический риск
  • минимальная термическая релаксация при нормальных условиях

Если рассматривать именно долговременное хранение без питания:

HDD в среднем устойчивее и понятнее.

Если рассматривать интенсивную нагрузку 24/7:

Enterprise SSD устойчивее к ошибкам чтения и дают более предсказуемую деградацию.