Рейтинг
0.00

Backblaze Хостинг

2 читателя, 80 топиков

Статистика Backblaze Drive за второй квартал 2023 года



В конце второго квартала 2023 года Backblaze отслеживала 245 757 жестких дисков и твердотельных накопителей в наших центрах обработки данных по всему миру. Из этого числа 4460 являются загрузочными дисками, 3144 — твердотельными накопителями и 1316 — жесткими дисками. Частота отказов твердотельных накопителей анализируется в обзоре SSD Edition: 2022 Drive Stats.

Сегодня мы сосредоточимся на 241 297 накопителях данных, находящихся под управлением, и проанализируем их ежеквартальную и пожизненную частоту отказов по состоянию на конец второго квартала 2023 года. некоторые дополнительные поля данных, которые мы теперь включаем, и многое другое.

Частота отказов жестких дисков за второй квартал 2023 г.
В конце второго квартала 2023 года мы управляли 241 297 жесткими дисками, используемыми для хранения данных. Для нашего обзора мы исключили из рассмотрения 357 накопителей, поскольку они использовались для целей тестирования или моделей накопителей, в которых не было по крайней мере 60 дисков. Это оставляет нам 240 940 жестких дисков, сгруппированных в 31 модель. В таблице ниже приведена годовая частота отказов (AFR) для этих моделей накопителей за второй квартал 2023 года.


Примечания и наблюдения по статистике привода за второй квартал 2023 г.
Отсутствие отказов. Во втором квартале 2023 г. было шесть моделей накопителей без отказов, как показано в таблице ниже.


Таблица отсортирована по количеству дней вождения каждой модели за квартал. Как правило, модель вождения должна иметь не менее 50 000 дней вождения в квартале, чтобы быть статистически значимой. Все три ведущих диска соответствуют этому критерию, и отсутствие сбоев за квартал неудивительно, учитывая, что AFR за весь срок службы для трех дисков колеблется от 0,13% до 0,45%. Ни один из трех нижних дисков не накопил 50 000 дней работы в квартале, но два диска Seagate показали хороший старт. И всегда приятно видеть, что Toshiba емкостью 4 ТБ (модель: MD04ABA400V) с восемью годами службы не имеет ни одного сбоя за квартал.

Самый старый диск? Моделью диска с самым старым средним возрастом по-прежнему является Seagate емкостью 6 ТБ (модель: ST6000DX000) с возрастом 98,3 месяца (8,2 года), а возраст самого старого диска в этой когорте составляет 104 месяца (8,7 года).

Самым старым рабочим накопителем данных в парке является Seagate емкостью 4 ТБ (модель: ST4000DM000) с возрастом 105,2 месяца (8,8 года). Это впечатляет, особенно в среде центра обработки данных, но победителем в номинации «Самый старый действующий диск в нашем парке» на самом деле является загрузочный диск: диск WDC емкостью 500 ГБ (модель: WD5000BPKT) со сроком службы 122 месяца (10,2 года).

Повышение AFR: AFR во втором квартале 2023 г. составил 2,28% по сравнению с 1,54% в первом квартале 2023 г. Хотя квартальные показатели AFR могут быть неустойчивыми, они также могут быть полезны для выявления тенденций, требующих дальнейшего изучения. В данном случае рост был ожидаем, так как возраст нашего флота продолжает увеличиваться. Но было ли это настоящей причиной?

Углубившись, мы начнем с годовой частоты отказов и среднего возраста наших дисков, сгруппированных по размеру диска, как показано в таблице ниже.


Для нашей цели мы определим диск как старый, если ему исполнилось пять или более лет. Почему? Это гарантийный срок дисков, которые мы покупаем сегодня. Конечно, на диски емкостью 4 ТБ и 6 ТБ, а также на некоторые из дисков емкостью 8 ТБ распространяется только двухлетняя гарантия, но для согласованности мы будем придерживаться пяти лет в качестве точки, по достижении которой диск помечается как «старый».

Использование нашего определения для старых дисков исключает диски емкостью 12 ТБ, 14 ТБ и 16 ТБ. Это оставляет нам приведенную ниже диаграмму ежеквартального AFR за последние три года для каждой группы старых дисков, моделей емкостью 4 ТБ, 6 ТБ, 8 ТБ и 10 ТБ.


Интересно, что самые старые диски емкостью 4 ТБ и 6 ТБ выдерживают свои испытания. Да, за последний год или около того произошло увеличение, но, учитывая их возраст, у них все хорошо.

С другой стороны, диски емкостью 8 ТБ и 10 ТБ со средним сроком службы пять и шесть лет соответственно требуют дополнительного внимания. Далее в этом отчете мы рассмотрим данные о продолжительности жизни, чтобы убедиться, что наши выводы оправданы.

Что нового в данных Drive Stats?
В течение последних 10 лет мы собираем и храним данные статистики дисков, а с 2015 года мы открыли исходный код файлов данных, которые мы использовали для создания отчетов статистики дисков. Время от времени в схему добавляются новые пары атрибутов SMART, поскольку мы устанавливаем новые модели дисков, которые сообщают о новых наборах атрибутов SMART. В этом квартале мы решили собрать и сохранить некоторые дополнительные поля данных о дисках и среде, в которой они работают, и добавили их в общедоступные файлы статистики дисков, которые мы публикуем каждый квартал.

Новые поля данных
Начиная с данных Drive Stats за Q2 2023, в каждой записи диска появляются три новых поля данных.
  • Vault_id: все диски с данными являются членами хранилища Backblaze. Каждое хранилище состоит из 900 или 1200 жестких дисков, равномерно распределенных по 20 серверам хранения. Хранилище представляет собой числовое значение, начинающееся с 1000.
  • Pod_id: в каждом хранилище Backblaze есть 20 серверов хранения. Pod_id — это числовое поле со значениями от 0 до 19, назначенное одному из 20 серверов хранения.
  • Is_legacy_format: в настоящее время 0, но будет полезен в ближайшие кварталы по мере добавления дополнительных полей.
Новая схема выглядит следующим образом:
  • date
  • serial_number
  • model
  • capacity_bytes
  • failure
  • vault_id
  • pod_id
  • is_legacy_format
  • smart_1_normalized
  • smart_1_raw
  • Remaining SMART value pairs (as reported by each drive model)
Оставшиеся пары значений SMART (согласно каждой модели диска)
Время от времени наши читатели спрашивали, есть ли у нас дополнительная информация о том, где живет диск и, что более важно, где он умер. Недавно добавленные поля данных выше являются частью внутренних данных о диске, которые мы собираем каждый день, но они не были включены в данные статистики диска, которые мы используем для создания отчетов статистики диска. С помощью Дэвида из нашей команды Infrastructure Software эти поля теперь будут доступны в данных Drive Stats.

Как мы можем использовать информацию о Vault и Pod?
Сначала предостережение: у нас есть ровно четверть этих новых данных. Хотя было заманчиво создавать диаграммы и таблицы, мы хотим увидеть данные за пару кварталов, чтобы лучше понять их. Ищите первоначальный анализ позже в этом году.

Тем не менее, эти данные дают нам сервер хранения и хранилище каждого диска. Работая в обратном направлении, мы должны иметь возможность задавать такие вопросы, как: «Являются ли определенные серверы хранения более склонными к отказу дисков?» или «Какие модели дисков лучше или хуже работают с определенными серверами хранения?» Кроме того, мы надеемся добавить такие элементы данных, как тип сервера хранения и центр обработки данных, чтобы предоставить дополнительную информацию о нашей платформе облачного хранилища с несколькими эксабайтами.

На протяжении многих лет мы использовали данные Drive Stats внутри компании, чтобы повысить эффективность работы и надежность. Предоставление этих новых элементов данных всем через наши отчеты Drive Stats и загрузку данных — это правильное решение.

В городе появился новый драйв
Если вы все же решите скачать наши данные Drive Stats за второй квартал 2023 года, вас ждет сюрприз — новая модель накопителя. Таких дисков всего четыре, поэтому их легко не заметить, и они не указаны ни в одной из таблиц и диаграмм, которые мы публикуем, поскольку на данный момент они считаются «тестовыми» дисками. Но если вы просматриваете данные, выполните поиск модели «WDC WUH722222ALE6L4», и вы найдете наши недавно установленные диски WDC емкостью 22 ТБ. Они прошли тестирование в конце второго квартала и проходят испытания, пока мы говорим. Следите за обновлениями. (Псс, по состоянию на 28.07 ни один не вышел из строя.)

Частота отказов жестких дисков за весь срок службы
По состоянию на 30 июня 2023 г. мы отслеживали 241 297 жестких дисков, используемых для хранения данных клиентов. Для нашего анализа жизненного цикла мы удалили 357 дисков, которые использовались только в целях тестирования или не имели по крайней мере 60 дисков, представленных в полном наборе данных. Таким образом, у нас остается 240 940 жестких дисков, сгруппированных по 31 модели, для анализа приведенной ниже таблицы срока службы.


Примечания и наблюдения о статистике жизни
Пожизненный AFR также повышается. Годовая частота отказов за весь срок службы для всех перечисленных выше дисков составляет 1,45 %. Это на 0,05% больше, чем в предыдущем квартале на 1,40%. Ранее в этом отчете, изучив данные за второй квартал 2023 года, мы определили диски емкостью 8 ТБ и 10 ТБ в качестве основных подозреваемых в увеличении скорости. Давайте посмотрим, сможем ли мы подтвердить это, изучив изменение показателей AFR за весь срок службы различных дисков, сгруппированных по размеру.


Красная линия — это наш базовый уровень, так как это разница между Q1 и Q2 (0,05%) AFR за весь срок службы для всех дисков. Диски выше красной линии поддерживают увеличение, диски ниже линии вычитают из увеличения. Основными дисками (по размеру), которые «движут» увеличенную годовую частоту отказов в течение всего срока службы, являются диски емкостью 8 ТБ и 10 ТБ. Это подтверждает то, что мы обнаружили ранее. Учитывая, что накопителей на 10 ТБ относительно немного (1124) по сравнению с дисками на 8 ТБ (24 891), давайте углубимся в модели дисков на 8 ТБ.

Пожизненная AFR для всех дисков емкостью 8 ТБ подскочила с 1,42% в первом квартале до 1,59% во втором квартале. Увеличение на 12%. В эксплуатации находится шесть моделей накопителей емкостью 8 ТБ, но на три из этих моделей приходится 99,5 % отказов дисков для когорты накопителей емкостью 8 ТБ, поэтому мы сосредоточимся на них. Они перечислены ниже.


Для всех трех моделей увеличение годовой частоты отказов за весь срок службы с Q1 по Q2 составляет 10 % или более, что статистически аналогично увеличению на 12 % для всех моделей накопителей емкостью 8 ТБ. Если бы вам нужно было выбрать одну модель накопителя, на которую нужно было бы сосредоточиться при миграции, любой из трех был бы хорошим кандидатом. Но диски Seagate модели ST8000DM002 в среднем почти на год старше других рассматриваемых моделей дисков.

Не совсем всю жизнь? В приведенной выше таблице анализируются данные за период с 20 апреля 2013 г. по 30 июня 2023 г., или 10 лет, 2 месяца и 10 дней. Как отмечалось ранее, самому старому диску, который у нас есть, 10 лет и 2 месяца, плюс-минус день или два. Казалось бы, нам нужно изменить заголовок нашей таблицы, но пока не совсем. Диск, который был установлен в любое время во втором квартале 2013 года и все еще работает сегодня, будет сообщать о днях работы диска как часть данных о сроке службы для этой модели. Как только все диски, установленные во втором квартале 2013 года, исчезнут, мы сможем соответствующим образом изменить дату начала в наших таблицах и диаграммах.

Несколько слов об отказе привода
Беспокоит ли нас увеличение количества отказов накопителей? Конечно, нам бы хотелось, чтобы они были ниже, но неизбежная реальность бизнеса облачных хранилищ заключается в том, что диски выходят из строя. За прошедшие годы мы наблюдали широкий диапазон частот отказов у разных производителей, моделей и размеров дисков. Если вы не готовы к этому, вы потерпите неудачу. В рамках нашей подготовки мы используем данные статистики дисков как один из многих входных данных для понимания нашей среды, чтобы мы могли корректировать, когда и как нам нужно.

Итак, нас беспокоит увеличение количества отказов накопителей? Нет, но мы и не высокомерны. Мы продолжим следить за нашими системами, при необходимости примем меры и по ходу дела поделимся с вами тем, что сможем.

Данные статистики жесткого диска
Полный набор данных, использованных для создания информации, используемой в этом обзоре, доступен на нашей веб-странице «Статистика жесткого диска». Вы можете скачать и использовать эти данные бесплатно в своих целях. Все, что мы просим, это три вещи: 1) вы указываете Backblaze в качестве источника, если вы используете данные, 2) вы соглашаетесь с тем, что вы несете единоличную ответственность за то, как вы используете данные, и 3) вы никому не продаете эти данные; это бесплатно.

Если вы хотите, чтобы таблицы и диаграммы использовались в этом отчете, вы можете загрузить ZIP-файл из облачного хранилища Backblaze B2, который содержит электронную таблицу MS Excel с вкладками для каждой из таблиц или диаграмм.

Удачи и дайте нам знать, если вы найдете что-нибудь интересное.

Статистика Backblaze Drive за первый квартал 2023 года

Давным-давно в далекой-далекой галактике мы начали собирать и хранить данные Drive Stats. Точнее это было 10 лет назад, а галактика была как раз Северной Калифорнией, хотя с тех пор она расширилась (как известно галактики делают). За последние 10 лет многое произошло с тем, где, когда и как мы получаем данные статистики вождения, но, тем не менее, данные статистики вождения за первый квартал 2023 года готовы, так что давайте начнем.

По состоянию на конец первого квартала 2023 года Backblaze отслеживала 241 678 жестких дисков (HDD) и твердотельных накопителей (SSD) в наших центрах обработки данных по всему миру. Из этого числа 4400 являются загрузочными дисками, из них 3038 твердотельных накопителей и 1362 жестких диска. Частота отказов твердотельных накопителей анализируется в обзоре SSD Edition: 2022 Drive Stats.

Сегодня мы сосредоточимся на 237 278 дисках с данными, находящихся под управлением, и проанализируем их ежеквартальную и пожизненную частоту отказов по состоянию на конец первого квартала 2023 года. более. Попутно мы будем делиться своими наблюдениями и выводами о представленных данных и, как всегда, надеемся, что вы сделаете то же самое в разделе комментариев в конце поста.

Частота отказов жестких дисков за первый квартал 2023г.
Начнем с обзора наших данных за первый квартал 2023 года. В этом квартале мы отследили 237 278 жестких дисков, используемых для хранения данных клиентов. Для нашей оценки мы исключили из рассмотрения 385 дисков, поскольку они использовались для целей тестирования или представляли собой модели дисков, в которых не было по крайней мере 60 дисков. Это оставляет нам 236 893 жестких диска, сгруппированных по 30 различным моделям для анализа.


Примечания и наблюдения по статистике привода за первый квартал 2023 г.
Повышение AFR: Годовая частота отказов (AFR) за 1 квартал 2023 г. составила 1,54%, что выше, чем в 4 квартале 2022 г. на 1,21%, и по сравнению с 1 кварталом 2022 г. год назад на 1,22%. Квартальные показатели AFR могут быть неустойчивыми, но они могут быть полезны для определения тенденции, требующей дальнейшего изучения. Например, три диска в первом квартале 2023 года (перечисленные ниже) более чем удвоили свой индивидуальный AFR с четвертого квартала 2022 года по первый квартал 2023 года. Как следствие, требуется дополнительная проверка (или, в некоторых случаях, продолжение проверки) этих дисков.

Нули и единицы: в приведенной ниже таблице показаны модели дисков, у которых в первом квартале 2023 г. не было ни одного, ни одного отказа.


При просмотре таблицы любая модель привода с менее чем 50 000 дней вождения за квартал не имеет достаточного количества данных для статистической значимости за этот период. Тем не менее, для двух из перечисленных моделей приводов сообщение об отсутствии сбоев не является чем-то новым. У Seagate на 16 ТБ (модель: ST16000NM002J) также не было сбоев в прошлом квартале, а у Seagate на 8 ТБ (модель: ST8000NM000A) не было сбоев с момента его первой установки в третьем квартале 2022 года, при этом AFR за весь срок службы составляет 0 %.

Новая, но не такая уж новая модель накопителя: в первом квартале 2023 года появится одна новая модель накопителя — Toshiba емкостью 8 ТБ (модель: HDWF180). На самом деле, это не ново, просто в этом квартале у нас сейчас в производстве 60 дисков, так что это попало в чарты. Эта модель фактически находится в производстве с первого квартала 2022 года, начиная с 18 дисков и со временем добавляя больше дисков. Почему? Эта модель диска заменит некоторые из 187 отказавших дисков емкостью 8 ТБ в этом квартале. У нас есть запасы дисков разных размеров, которые мы держим под рукой именно по этой причине.
Количество отказов в годовом исчислении за 1 квартал 2023 г. по размеру накопителя и производителю
На приведенных ниже диаграммах приведены данные за первый квартал 2023 года сначала по размеру диска, а затем по производителю.


Хотя мы включили все размеры дисков, которые мы используем в настоящее время, размеры дисков 6 ТБ и 10 ТБ состоят из одной модели для каждой, и у каждого есть ограниченное количество дней работы в квартале: 79 651 для дисков 6 ТБ и 105 443 для дисков 10 ТБ. Каждый из оставшихся размеров дисков имеет не менее 2,2 миллиона дней работы, что делает их квартальные годовые коэффициенты отказов более надежными.


В этой таблице объединены все модели приводов производителя независимо от их возраста. В нашем случае многие из старых моделей накопителей произведены Seagate, и это помогает повысить их общую AFR. Например, 60 % дисков емкостью 4 ТБ произведены Seagate, и их средний возраст составляет 89 месяцев, а более 95 % находящихся в производстве дисков емкостью 8 ТБ произведены Seagate, и им в среднем более 70 месяцев. Как мы видели, изучая ожидаемый срок службы жесткого диска с помощью кривой ванны, старые диски имеют тенденцию к более частым отказам.

Тем не менее, есть исключения, такие как наш бесстрашный парк дисков Seagate емкостью 6 ТБ, средний возраст которых составляет 95,4 месяца, а показатель AFR за первый квартал 2023 года составляет 0,92 %, а показатель AFR за весь срок службы — 0,89 %, как мы увидим далее в этом отчете.

Средний возраст отказа диска
Недавно ребята из Blocks & Files опубликовали статью, в которой описывается средний возраст жесткого диска на момент выхода из строя. Статья основана на работе Тимоти Берли в Secure Data Recovery. Подводя итог, статья показала, что для 2007 проанализированных отказавших жестких дисков средний возраст выхода из строя составил 1051 день, или два года и 10 месяцев. Мы подумали, что это интересный способ взглянуть на отказ диска, и мы хотели знать, что мы обнаружим, если зададим тот же вопрос о наших данных Drive Stats. Они также определили текущее количество ожидающих секторов для каждого отказавшего диска, но сегодня мы сосредоточимся на среднем возрасте отказа диска.

Начиная
В статье не указано, как они собирали количество времени, в течение которого диск работал до того, как он вышел из строя, но мы предполагаем, что они использовали необработанное значение SMART 9 для часов включения. Учитывая это, нашей первой задачей было собрать все неисправные диски в нашем наборе данных и записать время работы каждого диска. Этот запрос выдал список из 18 605 дисков, которые вышли из строя в период с 10 апреля 2013 г. по 30 марта 2023 г. включительно.

Для каждого вышедшего из строя диска мы записали дату, серийный_номер, модель, емкость_диска, сбой и необработанное значение SMART 9. Образец ниже.


Чтобы начать процесс очистки данных, мы сначала удалили из набора данных 1355 неисправных загрузочных дисков, оставив нам 17 250 дисков с данными.

Затем мы удалили 95 дисков по одной из следующих причин:
  • На отказавшем диске не было записанных данных или был ноль в атрибуте SMART 9 raw.
  • Неисправный диск имел данные за пределами допустимых значений в одном или нескольких полях.
Например, поле capacity_bytes было отрицательным или модель повреждена, то есть неизвестна или непонятна.
В обоих этих случаях рассматриваемые диски находились в неудовлетворительном состоянии на момент сбора данных, и поэтому любые другие собранные данные могли быть ненадежными.

У нас осталось 17 155 неисправных дисков для анализа. Когда мы вычисляем средний возраст, в котором эта когорта дисков вышла из строя, мы получаем 22 360 часов, что составляет 932 дня, или чуть более двух лет и шести месяцев. Это довольно близко к двум годам и 10 месяцам из статьи Blocks & Files, но прежде чем мы подтвердим их цифры, давайте немного углубимся в наши результаты.

Средний возраст отказов дисков по моделям и размерам
Наш набор данных Drive Stats содержит сведения о сбоях дисков для 72 моделей дисков, и это число не включает загрузочные диски. Чтобы сделать нашу таблицу более управляемой, мы ограничили список теми моделями накопителей, в которых зафиксировано 50 и более отказов. Полученный список содержит 30 моделей, которые мы отсортировали по среднему возрасту отказов:


Как и следовало ожидать, существуют модели накопителей старше и младше нашего общего среднего возраста отказов, составляющего два года и шесть месяцев. Одно наблюдение состоит в том, что средний срок отказа многих моделей накопителей меньшего размера (1 ТБ, 1,5 ТБ, 2 ТБ и т. д.) выше, чем наш общий средний показатель, составляющий два года и шесть месяцев. И наоборот, для многих моделей дисков большего размера (12 ТБ, 14 ТБ и т. д.) средний срок службы после отказа был ниже среднего. Прежде чем делать какие-либо выводы, давайте посмотрим, что произойдет, если мы рассмотрим средний возраст отказа по размеру диска, как показано ниже.


Эта диаграмма, по-видимому, подтверждает общую тенденцию, заключающуюся в том, что средний срок службы до отказа небольших моделей дисков выше, чем у более крупных моделей.

На этом этапе вы можете начать размышлять о том, повлияют ли технологии в более крупных накопителях, такие как дополнительные пластины, повышенная плотность записи или даже использование гелия, на средний срок службы этих накопителей. Но как сказал бы невозмутимый адмирал Акбар:

«Это ловушка»
Ловушка заключается в том, что набор данных для моделей дисков меньшего размера в нашем случае является полным — в нашем наборе данных больше нет дисков емкостью 1 ТБ, 1,5 ТБ, 2 ТБ, 3 ТБ или даже 5 ТБ. Наоборот, большинство моделей дисков большего размера все еще находятся в эксплуатации и, следовательно, они «еще не перестали выходить из строя». Другими словами, поскольку эти более крупные диски будут продолжать выходить из строя в ближайшие месяцы и годы, они могут увеличить или уменьшить средний срок отказа этой модели диска.

Новая надежда
Один из способов продвинуться вперед на этом этапе — ограничить наши вычисления только теми моделями дисков, которые больше не используются в наших центрах обработки данных. Сделав это, мы обнаружим, что у нас есть 35 моделей дисков, состоящих из 3379 дисков, средний срок эксплуатации которых составляет два года и семь месяцев.

Ловушка или нет, но наши результаты согласуются со статьей Blocks & Files, поскольку их средний возраст неудачного набора данных составляет два года и 10 месяцев. Будет интересно посмотреть, как это сравнение сохранится с течением времени, поскольку все больше моделей накопителей в нашем наборе данных заканчивают свой срок службы Backblaze.

Второй способ взглянуть на неисправность диска — рассмотреть проблему с точки зрения ожидаемого срока службы. Этот подход берет пример из биологии и использует методы Каплана-Мейера для получения кривых ожидаемой продолжительности жизни (также известных как выживание) для различных когорт, в нашем случае для моделей жестких дисков. Мы использовали такие кривые ранее в наших сообщениях в блогах Hard Drive Life Expectancy и Bathtub Curve. Такой подход позволяет нам отслеживать частоту отказов с течением времени и помогает ответить на такие вопросы, как «Если я куплю диск сегодня, каковы шансы, что он прослужит x лет?»

Давайте подведем итоги
У нас есть три разных, но похожих значения среднего срока службы жестких дисков до отказа, и они следующие:


Когда мы впервые увидели средний возраст отказов безопасного восстановления данных, мы подумали, что два года и 10 месяцев — это слишком мало. Мы были удивлены тем, что нам рассказали наши данные, но немного математики еще никому не повредило. Учитывая, что мы всегда добавляем дополнительные неисправные диски в наш набор данных и попутно выводим из эксплуатации модели дисков, мы продолжим отслеживать средний возраст отказов наших моделей дисков и сообщим, если обнаружим что-нибудь интересное.

Частота отказов жестких дисков за весь срок службы
По состоянию на 31 марта 2023 г. мы отслеживали 237 278 жестких дисков. Для нашего анализа жизненного цикла мы удалили 385 дисков, которые использовались только в целях тестирования или не имели по крайней мере 60 дисков. Таким образом, у нас остается 236 893 жестких диска, сгруппированных по 30 различным моделям, для анализа приведенной ниже таблицы срока службы.


Примечания и наблюдения о статистике жизни
Срок службы AFR для всех перечисленных выше дисков составляет 1,40%. Это незначительное увеличение по сравнению с предыдущим кварталом на 1,39%. Число AFR за весь срок службы для всех наших жестких дисков, по-видимому, составляет около 1,40%, хотя каждая модель диска имеет свое уникальное значение AFR.

В течение последних 10 лет мы собираем и храним данные Drive Stats, которые являются источником AFR за весь срок службы, перечисленных в таблице выше. Но зачем вообще отслеживать данные? Что ж, помимо создания этого отчета каждый квартал, мы используем данные для внутреннего использования, чтобы помочь нам вести наш бизнес. Хотя на решения, которые мы принимаем, влияет множество других факторов, данные Drive Stats помогают быстрее выявлять потенциальные проблемы, позволяют нам предпринимать более обоснованные действия, связанные с дисками, и в целом добавляют уровень уверенности в решениях, которые мы принимаем на основе дисков.

Backblaze Is 16!



Эй, мы можем водить! (Каламбур.) Иногда трудно поверить, что то, что начиналось как «сумасшедший» сон в квартире с одной спальней, превратилось в то, что мы празднуем сегодня — 16 лет сверкания (каламбур, кхм, тоже задумано).

Чтобы отметить это событие, мы решили поделиться некоторыми яркими моментами прошлых лет. Если вы хотите услышать, как соучредитель и генеральный директор Глеб Будман рассказывает о нашей эволюции (а также о том, как, по его мнению, будет развиваться облачное хранилище в будущем), ознакомьтесь с его недавним выступлением в подкасте Cloudcast.

И вот еще несколько замечательных моментов для вашего удовольствия от чтения и просмотра:
  • Вернёмся к этой статье, посвящённой нашей пятилетней годовщине — в ней есть несколько отличных фотографий.
  • Посмотрите наш самый первый вирусный момент, Петабайты с ограниченным бюджетом, и узнайте больше о наших модулях хранения в том виде, в каком они существуют сегодня.
  • Узнайте, как сообщество Backblaze объединилось для фарминга жестких дисков во время кризиса с накопителями в Таиланде.
  • Читайте о том, как нас чуть не купили; затем, позже, наше объявление об IPO и мысли о том, почему большему количеству компаний следует рассмотреть возможность выхода на биржу.
  • Покопайтесь в отчетах и данных Drive Stats с самого начала (10 лет назад!).
  • Просмотрите некоторые из наших технических материалов, таких как наша статья о стирающем кодировании Рида-Соломона, история Python Gil и балансировка нагрузки при управлении серверами.
Вы уже знаете, что в блоге Backblaze есть намного больше, и мы любим общаться с людьми в комментариях к статьям и в социальных сетях. Ведь без вас всех нас бы не было!

Спасибо, что поддерживали нас на протяжении многих лет. Если вам хочется распространять любовь, вы всегда можете порекомендовать друга. (Вам будет предложено войти в систему, чтобы получить кредит за реферала.) Ваш друг получит месяц бесплатно, чтобы попробовать Backblaze, и когда они зарегистрируются, вы тоже получите один!

www.backblaze.com/blog/backblaze-is-16/

Статистика Backblaze Drive за 2022 год



По состоянию на 31 декабря 2022 года у нас в управлении было 235 608 дисков. Из этого числа было 4 299 загрузочных дисков и 231 309 дисков с данными. Этот отчет будет посвящен нашим дискам данных. Мы рассмотрим частоту отказов жестких дисков за 2022 г., сравним эти показатели с предыдущими годами и представим статистику отказов за весь срок службы для всех моделей жестких дисков, используемых в нашем центре обработки данных по состоянию на конец 2022 г. Попутно мы поделитесь своими наблюдениями и выводами о представленных данных, и, как всегда, мы надеемся, что вы сделаете то же самое в разделе комментариев в конце поста.

Частота отказов жестких дисков в 2022г.
В конце 2022 года Backblaze отслеживала 231 309 жестких дисков, используемых для хранения данных. Для нашей оценки мы исключили из рассмотрения 388 дисков, которые использовались либо для целей тестирования, либо для моделей дисков, для которых у нас не было по крайней мере 60 дисков. Это оставляет нам 230 921 жесткий диск для анализа для этого отчета.


Наблюдения и примечания
Один ноль за год

В 2022 году только один накопитель Seagate емкостью 8 ТБ (модель: ST8000NM000A) не имел сбоев. Этот «ноль» имеет некоторые оговорки: у нас в эксплуатации всего 79 накопителей, а срок службы накопителя ограничен — 22 839 дней. Эти диски используются в качестве запасных для замены вышедших из строя дисков емкостью 8 ТБ.

Как насчет старых парней?
  • Жесткий диск Seagate емкостью 6 ТБ (модель: ST6000DX000) — самый старый в нашем парке со средним возрастом 92,5 месяца. В 2021 году его годовая частота отказов (AFR) составляла всего 0,11%, но к 2022 году он немного снизился до 0,68%. Очень приличный показатель в любое время, но особенно после почти восьми лет службы.
  • Средний возраст накопителей Toshiba емкостью 4 ТБ (модель: MD04ABA400V) составляет 91,3 месяца. В 2021 году этот диск имеет AFR 2,04%, а в 2022 году он подскочил до 3,13%, включая три отказа диска. Учитывая ограниченное количество дисков и дней вождения для этой модели, если бы в 2022 году произошло только два отказа дисков, AFR составил бы 2,08%, или почти такой же, как в 2021 году.
  • Обе эти модели дисков имеют относительно небольшое количество дней вождения, поэтому достоверность показателей AFR является спорной. Тем не менее, оба диска хорошо себя зарекомендовали на протяжении всего срока службы.

Новые модели
В 2022 году мы добавили пять новых моделей, отказавшись от нуля, что дало нам в общей сложности 29 различных моделей, которые мы отслеживаем. Вот пять новых моделей:
  • HUH728080ALE604–8 ТБ
  • ST8000NM000A–8 ТБ
  • ST16000NM002J–16ТБ
  • MG08ACA16TA–16ТБ
  • WUH721816ALE6L4–16 ТБ
Две модели дисков емкостью 8 ТБ используются для замены неисправных дисков емкостью 8 ТБ. Три модели накопителей емкостью 16 ТБ дополняют ассортимент.

Сравнение статистики дисков за 2020, 2021 и 2022 годы
На приведенной ниже диаграмме сравниваются AFR за каждый из последних трех лет. Данные за каждый год включают только этот год и рабочие модели приводов, представленные на конец каждого года.


Выход из строя привода произошел в 2022 году
После небольшого увеличения AFR с 2020 по 2021 год произошло более заметное увеличение AFR в 2022 году с 1,01% в 2021 году до 1,37%. Что случилось? В наших ежеквартальных отчетах о статистике накопителей за второй квартал 2022 г. и третий квартал 2022 г. мы отметили увеличение общего показателя AFR по сравнению с предыдущим кварталом и объяснили это старением парка накопителей. Но так ли это на самом деле? Давайте рассмотрим некоторые действующие факторы, которые могут вызвать рост AFR в 2022 году. Начнем с размера диска.

Размер диска и сбой диска
На приведенной ниже диаграмме сравниваются AFR 2021 и 2022 для наших больших дисков (которые мы определили как диски емкостью 12 ТБ, 14 ТБ и 16 ТБ) с нашими меньшими дисками (которые мы определили как диски емкостью 4 ТБ, 6 ТБ, 8 ТБ и 10 ТБ).


За исключением дисков емкостью 16 ТБ, AFR каждого размера увеличился с 2021 по 2022 год. В случае с небольшими дисками увеличение было заметным, и 2,12% значительно превышают AFR 1,37% для 2022 года для всех дисков. диски.

Кроме того, хотя на когорту небольших дисков приходится всего 28,7% дней работы в 2022 году, на них приходится 44,5% отказов дисков. Наши меньшие диски выходят из строя чаще, но они также старше, поэтому давайте рассмотрим это подробнее.

Возраст диска и сбой диска
При изучении корреляции возраста диска и отказа диска мы должны начать с нашего предыдущего взгляда на кривую ванны отказа жесткого диска. Там мы пришли к выводу, что диски, как правило, чаще выходят из строя по мере их старения. Чтобы увидеть, имеет ли это значение здесь, мы начнем с таблицы ниже, в которой показан средний возраст каждой модели дисков по размеру.


За исключением дисков Seagate емкостью 8 ТБ (модель: ST8000NM000A), которые мы недавно приобрели в качестве замены вышедшим из строя дискам емкостью 8 ТБ, диски аккуратно попадают в две указанные выше группы — 10 ТБ и меньше и 12 ТБ и выше.

Теперь давайте сгруппируем отдельные модели накопителей в когорты, определяемые размером накопителя. Но прежде чем мы это сделаем, мы должны помнить, что модели дисков емкостью 6 ТБ и 10 ТБ имеют относительно небольшое количество дисков и дисковых дней по сравнению с остальными группами дисков. Кроме того, когорты дисков емкостью 6 ТБ и 10 ТБ состоят из одной модели дисков, а в другие группы дисков входят как минимум четыре разные модели дисков. Тем не менее их исключение кажется неполным, поэтому мы включили таблицы с когортами дисков 6 ТБ и 10 ТБ и без них.


В каждой таблице показано соотношение для каждого размера диска между средним возрастом дисков и связанным с ними AFR. Диаграмма справа (V2) ясно показывает, что старые диски, сгруппированные по размеру, выходят из строя чаще. Это увеличение по мере старения модели привода соответствует кривой ванны, о которой мы говорили ранее.

Итак, что вызвало увеличение отказов дисков и имеет ли это значение?
Старение нашего парка жестких дисков кажется наиболее логичной причиной увеличения AFR в 2022 году. Мы могли бы копнуть глубже, но на данный момент это, вероятно, спорно. Видите ли, мы потратили 2022 год на развитие нашего присутствия в двух новых центрах обработки данных: объекте Nautilus в Стоктоне, штат Калифорния, и объекте CoreSite в Рестоне, штат Вирджиния. Ожидается, что в 2023 году мы сосредоточимся на замене старых дисков на жесткие диски емкостью 16 ТБ и больше. Диски на 4 ТБ и да, даже наш O.G. Диски Seagate емкостью 6 ТБ могут пойти. Мы будем держать вас в курсе.

Отказы дисков по производителям
Мы рассмотрели отказы дисков по возрасту и размеру дисков, поэтому правильнее рассматривать отказы дисков по производителям. Ниже мы нанесли ежеквартальный AFR за последние три года по производителям.


Начиная с первого квартала 2021 г. и до конца 2022 г., мы видим, что общий рост общего показателя AFR за это время, по-видимому, обусловлен Seagate и, в меньшей степени, Toshiba, хотя HGST вносит значительный вклад в первый квартал 2022 г. рост. В случае с Seagate это имеет смысл, поскольку большинство наших дисков Seagate значительно старше, чем диски любых других производителей.

Прежде чем выбросить свои диски Seagate и Toshiba в мусорное ведро, вы можете рассмотреть стоимость жизненного цикла данной модели жесткого диска по сравнению с частотой его отказов. Мы рассмотрели это в нашем отчете о статистике накопителей за третий квартал 2022 года и обрисовали компромиссы между стоимостью накопителей и количеством отказов. Например, в целом диски Seagate дешевле, а частота их отказов в нашей среде обычно выше. Но частота их отказов, как правило, недостаточно высока, чтобы сделать их менее рентабельными в течение всего срока службы. Вы могли бы привести убедительные доводы в пользу того, что для нас многие модели накопителей Seagate так же экономичны, как и более дорогие накопители. Помогает то, что наша платформа облачного хранилища B2 создана с учетом отказа дисков, но мы признаем, что меньшее количество отказов дисков никогда не бывает плохим.

Статистика жесткого диска за весь срок службы
В таблице ниже указан срок службы AFR всех моделей приводов, находящихся в производстве по состоянию на 31 декабря 2022 г.


Текущий показатель AFR за весь срок службы составляет 1,39%, что меньше, чем год назад (1,40%), а также меньше, чем в прошлом квартале (1,41%). AFR за весь срок службы менее подвержен быстрым изменениям из-за временных колебаний отказов накопителя и является хорошим индикатором AFR модели накопителя. Но чтобы быть уверенным в этом, требуется немало наблюдений (в нашем случае — дней езды). С этой целью в приведенной ниже таблице показаны только те модели дисков, которые накопили один миллион дней работы или более за свой срок службы. Мы упорядочили список по дням поездки.


Наконец, мы собираемся здесь немного раскрыться и поделиться результатами 388 дисков, которые мы исключили из нашего анализа, поскольку они были тестовыми дисками или моделями дисков с 60 или менее дисками. Эти диски разделены на 20 различных моделей дисков, и в таблице ниже перечислены модели дисков, которые работали в наших центрах обработки данных по состоянию на 31 декабря 2022 года. Большое предостережение: это всего лишь тестовые диски и так далее, так что будьте осторожны. Мы обычно игнорируем их в отчетах, так что это их шанс проявить себя или нет. Мы с нетерпением ждем ваших комментариев.


Есть много причин, по которым эти накопители дошли до этого момента в карьере Backblaze, но мы сохраним эти истории для другого раза. На данный момент мы просто делимся данными, чтобы быть откровенными, но, безусловно, есть что рассказать. Следите за обновлениями.

Версия SSD: обзор статистики накопителей за 2022



Добро пожаловать в выпуск SSD 2022 из серии Backblaze Drive Stats. Версия SSD ориентирована на твердотельные накопители (SSD), которые мы используем в качестве загрузочных дисков для серверов хранения данных на нашей платформе облачного хранения. Это отличается от наших традиционных отчетов Drive Stats, в которых основное внимание уделяется нашим жестким дискам (HDD), используемым для хранения данных клиентов.

Мы начали использовать твердотельные накопители в качестве загрузочных дисков, начиная с четвертого квартала 2018 года. С тех пор твердотельные накопители были установлены на всех новых серверах хранения и на всех неисправных загрузочных жестких дисках. Загрузочные диски в нашей среде выполняют гораздо больше функций, чем просто загружают серверы хранения. Каждый день они также читают, записывают и удаляют файлы журналов и временные файлы, создаваемые самим сервером хранения. Рабочая нагрузка одинакова для всех SSD, включенных в этот отчет.

В этом отчете мы рассматриваем частоту отказов твердотельных накопителей, которые мы используем в наших серверах хранения, на 2022 год, за последние 3 года и на весь срок службы твердотельных накопителей. Кроме того, мы впервые рассматриваем температуру наших твердотельных накопителей на 2022 год и сравниваем температуру твердотельных накопителей и жестких дисков, чтобы увидеть, действительно ли твердотельные накопители работают медленнее.

По состоянию на 31 декабря 2022 г. в качестве загрузочных дисков на наших серверах хранения использовалось 2906 твердотельных накопителей. Было использовано 13 различных моделей, большинство из которых считаются потребительскими твердотельными накопителями, и мы коснемся того, почему мы используем потребительские твердотельные накопители, чуть позже. В этом отчете мы покажем годовую частоту отказов (AFR) для этих моделей приводов за различные периоды времени, сделав наблюдения и сделав оговорки, чтобы помочь интерпретировать представленные данные.

Набор данных, на котором основан этот отчет, доступен для загрузки на нашей веб-странице тестовых данных Drive Stats. Данные SSD объединяются с данными HDD в одних и тех же файлах. К сожалению, сами данные не различают типы дисков SSD и HDD, поэтому вам нужно использовать поле модели, чтобы сделать это различие. Если вы просто ищете данные SSD, начните с Q4 2018 и продолжайте.

Ежегодная частота отказов твердотельных накопителей за 2022
Как уже отмечалось, на конец 2022 года в наших серверах хранения в эксплуатации находилось 2 906 твердотельных накопителей. В таблице ниже приведены данные за 2022 год. Позже мы сравним данные за 2022 год с предыдущими годами.


Наблюдения и предостережения
  • На 2022 год у семи из 13 моделей накопителей не было сбоев. Шесть из семи моделей имели ограниченное количество дней эксплуатации — менее 10 000 — а это означает, что данных недостаточно, чтобы сделать надежный прогноз частоты отказов этих моделей дисков.
  • Твердотельный накопитель Dell (модель: DELLBOSS VD) не имеет сбоев в 2022 году и имеет более 100 000 рабочих дней в году. Полученный AFR превосходен, но это твердотельный накопитель M.2, установленный на карту PCIe (форм-фактор половинной длины и половинной высоты), предназначенный для серверных развертываний, и поэтому он может быть недоступен. Кстати, BOSS расшифровывается как Boot Optimized Storage Solution.
  • Помимо твердотельного накопителя Dell, еще три модели накопителей имеют более 100 000 рабочих дней в году, поэтому данных достаточно, чтобы оценить интенсивность их отказов. Из трех моделей Seagate (модель: ZA250CM10003, он же: Seagate BarraCuda 120 SSD ZA250CM10003) имеет самый низкий AFR — 0,73%, Crucial (модель: CT250MX500SSD1) — следующий с AFR 1,04% и, наконец, Seagate (( модель: ZA250CM10002, она же: Seagate BarraCuda SSD ZA250CM10002) обеспечивает AFR 1,98% на 2022 год.

Ежегодная частота отказов твердотельных накопителей на 2020, 2021 и 2022 годы
На приведенной выше годовой диаграмме за 2022 год представлены данные о событиях, которые произошли только в 2022 году. Ниже мы сравниваем годовые данные за 2022 год с годовыми данными за 2020 и 2021 годы (соответственно), где данные за каждый год представляют только события, произошедшие в этот период.


Наблюдения и предостережения
  • Как и ожидалось, диски Crucial (модель: CT250MX500SSD1) хорошо восстановились в 2022 году после нескольких ранних сбоев в 2021 году. Мы ожидаем, что эта тенденция сохранится.
  • В 2022 году были представлены четыре новые модели, хотя ни у одной из них не было достаточного количества дней вождения, чтобы выявить какие-либо закономерности, хотя по состоянию на конец 2022 года ни одна из четырех моделей не вышла из строя.
  • Два из 250-гигабайтных дисков Seagate использовались все три года, но они развивались в разных направлениях. Жесткий диск Seagate (модель: ZA250CM10003) за все три года показал показатель AFR менее 1%. В то время как AFR для диска Seagate (модель: ZA250CM10002) снизился в 2022 году почти до 2%. Модель ZA250CM10003 новее двух примерно на год. В остальном разница незначительна, за исключением того, что ZA250CM10003 потребляет меньше энергии в режиме ожидания, 116 мВт против 185 мВт у ZA250CM10002. Будет интересно посмотреть, как поведет себя младшая модель в следующем году. Будет ли он следовать тенденции своего старшего брата и начнет чаще терпеть неудачи, или же он проложит свой собственный курс?

Температура SSD и AFR: первый взгляд
Прежде чем мы перейдем к частоте отказов SSD за весь срок службы, давайте поговорим о статистике SSD SMART. Здесь, в Backblaze, мы уже несколько месяцев боремся со статистикой SSD SMART, и одна вещь, которую мы обнаружили, заключается в том, что атрибуты или даже названия, которые производители SSD используют для записи своих различных данных SMART, не очень последовательны. Например, такие термины, как выравнивание износа, выносливость, срок службы, срок службы, записанные LBA, прочитанные LBA и т. д., используются разными производителями непоследовательно, часто с использованием разных атрибутов SMART, а иногда они вообще не записываются.

Одним из атрибутов SMART, который кажется постоянным (почти), является температура диска. SMART 194 (необработанное значение) записывает внутреннюю температуру SSD в градусах Цельсия. Мы говорим «почти», потому что твердотельный накопитель Dell (модель: DELLBOSS VD) не сообщает необработанные или нормализованные значения для SMART 194. На приведенной ниже диаграмме показана среднемесячная температура для остальных твердотельных накопителей, находящихся в эксплуатации в течение 2022 года.



Наблюдения и предостережения
  • В среднем в месяц производилось 67 724 наблюдения, от 57 015 в феврале до 77 174 в декабре. В 2022 году средняя температура за этот период изменилась всего на один градус Цельсия от минимального значения 34,4 градуса Цельсия до максимального значения 35,4 градуса Цельсия.
  • В 2022 году средняя температура составила 34,9 градуса по Цельсию. Средняя температура жестких дисков в тех же серверах хранения за тот же период составила 29,1 градуса Цельсия. Эта разница, кажется, идет вразрез с общепринятым мнением, согласно которому твердотельные накопители работают холоднее, чем жесткие диски. Одна из возможных причин заключается в том, что на всех наших серверах хранения загрузочные диски находятся дальше от холодного прохода, чем диски с данными. То есть диски с данными первыми получают холодный воздух. Если у вас есть какие-либо мысли, дайте нам знать в комментариях.
  • Колебание температуры на всех дисках в 2022 году колебалось от 20 градусов Цельсия (четыре наблюдения) до 61 градуса Цельсия (одно наблюдение). На приведенной ниже диаграмме показаны наблюдения за твердотельными накопителями в этом диапазоне температур.



Форма кривой должна выглядеть знакомо: это колоколообразная кривая. Мы видели тот же тип кривой при построении графика температуры жестких дисков сервера хранения. Кривая SSD предназначена для всех работающих SSD-накопителей, кроме SSD-накопителей Dell. Мы попытались построить такую же кривую для отказавших твердотельных накопителей, но с учетом всего 25 отказов в 2022 году кривая была бессмысленной.

Частота отказов твердотельных накопителей за весь срок службы
Частота отказов за весь срок службы основана на данных за все время эксплуатации данной модели диска в нашей системе. Эти данные относятся к четвертому кварталу 2018 года, хотя большая часть накопителей была введена в эксплуатацию за последние три года. В таблице ниже показан срок службы AFR для всех моделей SSD-накопителей, находящихся в эксплуатации по состоянию на конец 2022 года.


Наблюдения и предостережения
Общий AFR за весь срок службы составлял 0,89% на конец 2022 г. Это ниже, чем AFR за весь срок службы, составлявший 1,04% на конец 2021 г.
Существует несколько очень больших доверительных интервалов. Это связано с ограниченным объемом данных (дней вождения) для этих моделей дисков. Например, для модели WDC WD Blue SA510 2.5 всего 104 дня вождения. По мере накопления большего количества данных эти доверительные интервалы должны становиться более точными.
Нам нравится видеть доверительный интервал 1,0% или меньше для данной модели привода. Только три модели приводов соответствовали этому критерию:
  • Модель Dell DELLBOSS VD: срок службы AFR–0,00 %
  • Модель Seagate ZA250CM10003: срок службы AFR–0,66 %
  • Модель Seagate ZA250CM10002: срок службы AFR–0,96 %
Твердотельный накопитель Dell, как отмечалось ранее в этом отчете, представляет собой твердотельный накопитель M.2, установленный на карту PCIe, и может быть недоступен в широкой продаже. Два диска Seagate являются твердотельными накопителями потребительского уровня. В нашем случае для наших нужд подойдет менее дорогой SSD потребительского уровня, так как на загрузочном диске нет данных клиента, только загрузочные файлы, а также файлы журнала и временные файлы. Совсем недавно, когда мы приобрели серверы хранения у Supermicro и Dell, они объединяют все компоненты вместе по цене за единицу за сервер хранения. Если этот комплект включает твердотельные накопители корпоративного класса или твердотельный накопитель M.2 на карте PCIe, нас это устраивает.

Данные статистики SSD
Мы признаем, что 2906 твердотельных накопителей — это относительно небольшое количество дисков, на которых можно проводить наш анализ, и хотя это число приводит к более широким, чем хотелось бы, доверительным интервалам, это только начало. Разумеется, мы продолжим добавлять в учебную группу загрузочные SSD-накопители, что повысит достоверность представленных данных. Тем временем мы ожидаем, что наши читатели оценят представленные данные со своей обычной скептической точки зрения и будут использовать их соответствующим образом.

Полный набор данных, использованный для создания информации, используемой в этом обзоре, доступен на нашей странице данных тестирования жесткого диска. Как отмечалось ранее, вы найдете данные SSD и HDD в одних и тех же файлах, и вам придется использовать номер модели, чтобы отличить одну запись от другой. Вы можете скачать и использовать эти данные бесплатно в своих целях. Все, что мы просим, это три вещи: 1) вы указываете Backblaze в качестве источника, если вы используете данные, 2) вы соглашаетесь с тем, что вы несете единоличную ответственность за то, как вы используете данные, и 3) вы никому не продаете эти данные; это бесплатно.
www.backblaze.com/b2/hard-drive-test-data.html

Удачи, и дайте нам знать, если вы найдете что-нибудь интересное.

Статистика Backblaze Drive за 3 квартал 2022

По состоянию на конец третьего квартала 2022 года Backblaze отслеживала 230 897 жестких дисков и твердотельных накопителей в наших центрах обработки данных по всему миру. Из этого числа 4200 являются загрузочными дисками, из них 2778 твердотельных накопителей и 1422 жестких диска. Ранее твердотельные накопители были рассмотрены в нашем недавно опубликованном полугодовом отчете о твердотельных накопителях. Сегодня мы сосредоточимся на 226 697 дисках с данными, находящихся под управлением, и проанализируем их ежеквартальную и пожизненную частоту отказов по состоянию на конец третьего квартала 2022 года.

Мы также рассмотрим взаимосвязь между частотой отказов жестких дисков и стоимостью жестких дисков. Попутно мы будем делиться нашими наблюдениями и выводами о представленных данных, и, как всегда, мы надеемся, что вы сделаете то же самое в разделе комментариев в конце поста.

Показатели отказов жестких дисков в третьем квартале 2022 г.
Начнем с обзора наших данных за третий квартал 2022 года. В этом квартале мы отследили 226 697 жестких дисков, используемых для хранения данных. Для нашей оценки мы исключили из рассмотрения 388 дисков, поскольку они использовались для целей тестирования или модели дисков, в которых не было по крайней мере 60 дисков. Это оставляет нам 226 309 жестких дисков, сгруппированных по 29 различным моделям для анализа.



Примечания и наблюдения по статистике за второй квартал 2022 года
Ноль сбоев в третьем квартале. В этом квартале не было сбоев у трех дисков: HGST 8 ТБ (модель: HUH728080ALE604), Seagate 8 ТБ (модель: ST8000NM000A) и WDC 16 ТБ (модель: WUH721816ALE6L0). Для HGST на 8 ТБ это был второй квартал подряд без сбоев. Из трех только модель WDC имеет достаточно данных за весь срок службы (дней в пути), чтобы ее можно было использовать с расчетной годовой интенсивностью отказов (AFR). Как мы увидим позже в этом обзоре, эта модель WDC на 14 ТБ имеет AFR за весь срок службы 0,11% с диапазоном доверительного интервала всего 0,30 при доверительном уровне 95%.

Новые диски в городе. В данных этого квартала есть две новые модели: Seagate емкостью 8 ТБ (модель: ST8000NM000A) и Seagate емкостью 16 ТБ (модель: ST16000NM002J). Ни у того, ни у другого пока нет достаточно данных, чтобы быть интересными, но, как отмечалось выше, у Seagate емкостью 8 ТБ не было ни одного сбоя в первом квартале эксплуатации. Эти дополнения дают нам 29 различных моделей, которые мы отслеживаем, по сравнению с 27 в предыдущем квартале.

29 моделей разбиты по производителям следующим образом:
  • HGST: 7 моделей
  • Seagate: 13 моделей
  • Тошиба: 6 моделей
  • ВДК: 3 модели
На приведенной ниже диаграмме показано изменение нашего парка приводов за последние шесть лет в разбивке по производителям.


Старая гвардия чувствует себя старой: все три самых старых диска, которые мы используем в настоящее время, демонстрируют признаки своего возраста, поскольку каждый из них испытал увеличение AFR со второго по третий квартал 2022 года, как показано ниже.



Обратите внимание, что у Toshiba емкостью 4 ТБ в третьем квартале 2022 года было только два сбоя. Высокий показатель AFR (8,25%) связан с ограниченным количеством дней работы в квартале (8 849) всего с 95 дисками. Кажется, что у всех трех шпиндели, приводы и носители начинают изнашиваться примерно после семи лет постоянного вращения.

Квартальный AFR продолжает расти: AFR за третий квартал 2022 года составил 1,64%, увеличившись с 1,46% во втором квартале 2022 года и с 1,10% год назад. Как отмечалось ранее, это связано со старением всего парка приводов, и мы ожидаем, что это число уменьшится по мере того, как старые приводы будут выведены из эксплуатации и заменены в течение следующего года. Возможным предвестником того, что грядет, являются модели емкостью 16 ТБ, у которых в третьем квартале 2022 года показатель AFR составил 0,80 %. Поскольку эти диски используются для замены устаревших дисков емкостью 4 ТБ, квартальный показатель AFR должен снизиться.

Отказ жесткого диска по сравнению со стоимостью жесткого диска
Один из вопросов, который возникает, заключается в том, почему мы будем продолжать покупать модель накопителя, которая имеет более высокую годовую частоту отказов по сравнению с моделью сопоставимого размера, но более дорогой. Две основные причины: во-первых, мы можем это сделать, поскольку архитектура нашего облачного хранилища Backblaze Vault рассчитана на сбой диска. Во-вторых, изучая данные, такие как статистика дисков и тому подобное, мы усердно работаем, чтобы понять нашу среду изнутри. Понимание взаимосвязи между стоимостью и отказом диска является одним из таких уроков. Ниже приведен простой пример с использованием трех вымышленных моделей дисков емкостью 14 ТБ: Модель 1, Модель 2 и Модель 3.


Давайте посмотрим на разные разделы (т.е. синие строки) этой таблицы.

Стоимость диска: у каждой модели своя цена: низкая (225 долларов), средняя (250 долларов) и высокая (275 долларов). Мы бы купили одинаковое количество дисков (5000) каждой модели и получили бы стоимость каждой модели.

Годовой отказ привода: это показатель AFR для каждой модели привода. В этом примере мы присвоили модель с самой низкой ценой самой высокой частоте отказов, модель с самой высокой ценой — самой низкой частоте отказов и так далее. На практике мы будем использовать наши собственные номера AFR для данной модели, которую мы рассматриваем для покупки. Несмотря на это, мы получаем годовое количество отказавших дисков для каждой модели.

Ежегодные затраты на замену: затраты на рабочую силу покрывают человеческие затраты, связанные с выявлением неисправности, возвратом и заменой диска. Стоимость диска здесь равна нулю, поскольку предполагается, что все диски возвращаются для кредита или замены производителю или его агенту. Нулевое значение здесь может быть не всегда; отсюда и позиция. В любом случае вычисляются ежегодные затраты на замену отказавших дисков для каждой модели.

Стоимость замены в течение всего срока службы. Умножьте количество лет, в течение которых вы ожидаете, что модель диска будет служить, на ежегодные затраты на замену отказавших дисков. Все это дает нам общую стоимость каждой модели привода — персикового раздела. В нашем примере самая дорогая модель (модель 3) является самым дорогим приводом в течение пятилетнего ожидаемого срока службы, а самая дешевая модель привода (модель 1) является наименее дорогой за тот же период, даже при более высокой частоте отказов в годовом исчислении..

Но мы еще не закончили. Следующий вопрос: какой должна быть годовая частота отказов для наименее дорогостоящего варианта, модели 1, чтобы общая стоимость через пять лет была такой же, как у модели 2, а затем у модели 3? Другими словами, сколько неудач мы можем терпеть, прежде чем наше первоначальное решение о покупке окажется неверным? Когда мы подсчитываем цифры, мы получаем следующее:
  • Модель 1 и Модель 2 имеют одинаковую общую стоимость привода (1 325 000 долл. США), если годовая частота отказов для Модели 1 составляет 2,67%.
  • Модель 1 и Модель 3 имеют одинаковую общую стоимость привода (1 412 500 долл. США), если годовая частота отказов для Модели 1 составляет 3,83%.
Представленная модель представляет собой упрощенную версию того, как мы думаем о решениях о покупке дисков, используя годовую частоту отказов дисков как часть уравнения. Вы можете сделать эту модель более точной и сложной, добавив изменения частоты отказов дисков с течением времени (кривая ванны) и пропорционально распределив стоимость возврата неисправных дисков с годами. Нужно ли это, решать вам.

Необходимость такой модели важна в нашем бизнесе, если вы заинтересованы в оптимизации эффективности вашей платформы облачного хранения. В противном случае, просто роботизированная покупка самых дорогих или наименее дорогих дисков означает закрытие глаз на расходную часть бухгалтерской книги.

На уровне индивидуального или небольшого офиса/домашнего офиса ваше решение о покупке диска требует гораздо меньше математики и часто сводится к тому, какой диск вы можете себе позволить. Тем не менее, вы все равно должны попытаться провести некоторые исследования. Наша статистика дисков может помочь, но в любом случае у вас должен быть надежный план резервного копирования, поскольку ни один диск, который вы можете купить, не является надежным.

Частота отказов жестких дисков за весь срок службы
По состоянию на 30 сентября 2022 года Backblaze отслеживала 226 697 жестких дисков, используемых для хранения данных. Для нашей оценки мы исключили из рассмотрения 388 дисков, поскольку они использовались для целей тестирования или модели дисков, в которых не было по крайней мере 60 дисков. Таким образом, у нас остается 226 309 жестких дисков, сгруппированных по 29 различным моделям, для анализа отчета о сроке службы.


Примечания и наблюдения о статистике жизни
Годовая частота отказов за весь срок службы для всех перечисленных выше дисков составляет 1,41%. Это небольшое увеличение по сравнению с предыдущим кварталом на 1,39%, но ниже, чем год назад (3 квартал 2021 г.), который составлял 1,45%.

Обычную осторожность следует применять к тем моделям дисков, которые имеют широкие доверительные интервалы, один процент или больше. Такой разрыв указывает на то, что данных недостаточно или что данные, которые у нас есть, трудно предсказать.

Тем не менее, у нас есть множество моделей накопителей, по которым у нас есть достоверные данные. Ниже мы извлекли модели 12 ТБ, 14 ТБ и 16 ТБ из приведенной выше таблицы срока службы, у которых показатель AFR за весь срок службы составляет менее 1 %, а доверительный интервал — 0,5 % или менее. Это жесткие диски, которые до этого момента демонстрировали стабильную надежность в нашей среде.


Данные статистики жесткого диска
Полный набор данных, использованных для создания информации в этом обзоре, доступен на нашей странице данных тестирования жесткого диска. Вы можете скачать и использовать эти данные бесплатно в своих целях. Все, что мы просим, это три вещи: 1) вы указываете Backblaze в качестве источника, если вы используете данные, 2) вы соглашаетесь с тем, что вы несете единоличную ответственность за то, как вы используете данные, и 3) вы никому не продаете эти данные; это свободно.

Если вам нужны таблицы и диаграммы, используемые в этом отчете, вы можете загрузить файл .zip из облачного хранилища Backblaze B2, который содержит файлы .jpg и/или .xlsx, если применимо.

Отчет о статистике накопителей SSD за 2022 за середину года



Добро пожаловать в полугодовой выпуск SSD отчета Backblaze Drive Stats. Этот отчет основан на опубликованном ранее отчете SSD за 2021 год и основан на данных о SSD, которые мы используем в качестве загрузочных дисков сервера хранения на нашей платформе Backblaze Cloud Storage. Мы рассмотрим показатели отказов этих дисков за квартал и за весь срок службы, а позже в этом отчете мы также сравним производительность этих твердотельных накопителей с жесткими дисками, которые мы также используем в качестве загрузочных. Попутно мы будем предлагать наблюдения и выводы по представленным данным и, как всегда, ждем ваших вопросов и комментариев.

Обзор
Загрузочные диски в нашей среде не только загружают серверы хранения: они также хранят файлы журналов и временные файлы, созданные сервером хранения. Каждый день загрузочный диск будет читать, записывать и удалять файлы в зависимости от активности самого сервера хранения. В наших ранних серверах хранения мы использовали жесткие диски исключительно в качестве загрузочных дисков. Мы начали использовать твердотельные накопители в этом качестве в четвертом квартале 2018 года. С тех пор твердотельные накопители были установлены на всех новых серверах хранения, а также на всех серверах с неисправными загрузочными жесткими дисками.

Полугодовые результаты SSD по кварталам
По состоянию на 30 июня 2022 г. в наших серверах хранения было 2558 твердотельных накопителей. Это сопоставимо с 2200 твердотельными накопителями, о которых мы сообщили в нашем отчете о твердотельных накопителях за 2021 год. Мы начнем с представления и обсуждения квартальных данных за каждый из последних двух кварталов (1-й квартал 2022 года и 2-й квартал 2022 года).


Примечания и наблюдения
Форм-фактор: все перечисленные выше диски имеют стандартный форм-фактор 2,5 дюйма, за исключением моделей Dell (DELLVOSS VD) и Micron (MTFDDAV240TCB), каждая из которых имеет форм-фактор M.2.

Больше всего добавленных дисков: со времени нашего последнего отчета о SSD, закончившегося в четвертом квартале 2021 года, Crucial (модель: CT250MX500SSD1) лидирует с добавлением 192 новых дисков, за ним следует 101 новый диск DELL (модель: DELLBOSS VD) и 42 диска WDC (модель: WDS250G2B0A).

Новые модели дисков: во втором квартале 2022 года мы добавили две новые модели твердотельных накопителей, обе от Seagate: модель на 500 ГБ: ZA500CM10003 (3 диска) и модель на 250 ГБ: ZA250NM1000 (18 дисков). Ни у одного из них нет достаточного количества дисков или дней, чтобы сделать какие-либо выводы, хотя у каждого из них не было сбоев, так что хорошее начало.

Crucial не критичен: в нашем предыдущем отчете о SSD некоторые читатели выразили несогласие с высокой частотой отказов, о которой мы сообщили для Crucial SSD (модель: CT250MX500SSD1), хотя мы заметили, что это было с очень ограниченным объемом данных. Теперь, когда наши диски Crucial отлажены, у нас не было сбоев ни в первом, ни во втором квартале. Пожалуйста, отзовите собак.

Один удар, и вы выбыли: у трех дисков был только один отказ в данном квартале, но опубликованный ими AFR был заметным: модель WDC WDS250G2B0A — 10,93%, Micron — модель MTFDDAV240TCB — 4,52% и модель Seagate: SSD — 3,81 %. Конечно, если бы у любой из этих моделей было на 1 отказ меньше, их AFR был бы нулевым, зип, бупкус, нада — вы понимаете.

Это все хорошо: для любой данной модели диска в этой когорте твердотельных накопителей мы хотели бы видеть как минимум 100 дисков и 10 000 дисково-дней в данном квартале как минимум, прежде чем мы начнем считать расчетный AFR «разумным». Тем не менее, квартальные данные могут быть нестабильными, поэтому давайте теперь рассмотрим данные для каждого из этих дисков за время их существования.

Ежегодная частота отказов твердотельных накопителей за весь срок их службы
По состоянию на конец второго квартала 2022 года в наших серверах хранения было 2558 твердотельных накопителей. Приведенная ниже таблица основана на данных о сроке службы моделей накопителей, которые были активны на конец второго квартала 2022 года.


Примечания и наблюдения
Годовая частота отказов за весь срок службы (AFR): данные за весь срок службы являются кумулятивными за указанный период, в данном случае с четвертого квартала 2018 года по второй квартал 2022 года. По мере старения твердотельных накопителей можно использовать частоту отказов за весь срок службы, чтобы увидеть тенденции с течением времени. Мы увидим, как это работает, в следующем разделе, когда мы сравним годовую частоту отказов твердотельных накопителей и жестких дисков с течением времени.

Падение частоты отказов?: AFR за весь срок службы для всех твердотельных накопителей во втором квартале 2022 г. составил 0,92%. Это меньше, чем 1,04% в конце 2021 года, но точно такое же, как AFR во втором квартале 2021 года, составляющий 0,92%.

Доверительные интервалы. Как правило, чем больше у вас данных и чем более они последовательны, тем более вы уверены в своих прогнозах, основанных на этих данных. Для твердотельных накопителей нам нравится видеть доверительный интервал 1,0% или менее между низким и высоким значениями, прежде чем мы будем довольны расчетным AFR. Это не означает, что модели дисков с доверительным интервалом более 1,0% неверны, это просто означает, что мы хотели бы получить больше данных, чтобы быть уверенными.

Говоря о доверительных интервалах: из приведенной выше таблицы вы можете заметить, что три диска с самой высокой годовой частотой отказов за весь срок службы также имеют значительные доверительные интервалы.

И наоборот, есть три диска с доверительным интервалом 1% или меньше, как показано ниже:


Из этих трех дисковод Dell кажется лучшим. Это накопитель серверного класса в форм-факторе M.2, но для многих из нас он может быть вне диапазона цен, поскольку в настоящее время он продается у Dell за 468,65 долларов. Два оставшихся диска явно ориентированы на потребителя и имеют традиционный форм-фактор SSD. Модель Seagate ZA250CM10003 больше не продается как новая, только отремонтированная, а модель Seagate ZA250CM10002 в настоящее время доступна на Amazon за 45 долларов США.

Годовая частота отказов твердотельных накопителей в сравнении с жесткими дисками
В прошлом году мы сравнили частоту отказов твердотельных и жестких дисков, когда задались вопросом: действительно ли твердотельные накопители более надежны, чем жесткие диски? В то время ответ был «может быть». Теперь у нас есть данные за год, чтобы помочь ответить на этот вопрос, но сначала немного предыстории, чтобы наверстать упущенное.

Все твердотельные и жесткие диски, о которых мы сообщаем, являются загрузочными дисками. Они выполняют те же функции: загружают серверы хранения, записывают лог-файлы, служат временным хранилищем статистики SMART и так далее. Другими словами, они выполняют одни и те же задачи. Как отмечалось ранее, до конца 2018 года мы использовали жесткие диски, а затем перешли на твердотельные накопители. Это создает ситуацию, когда две когорты находятся на разных позициях соответствующих кривых ожидаемой продолжительности жизни.

Чтобы объективно сравнить твердотельные и жесткие диски, мы контролировали средний возраст двух когорт, так что твердотельные накопители, возраст которых в среднем составлял один год, сравнивались с жесткими дисками, возраст которых в среднем составлял один год, и так далее. На приведенной ниже диаграмме показаны результаты за второй квартал 2021 года, поскольку мы учитывали средний возраст двух когорт.


Во втором квартале 2021 года (4-й год на графике для твердотельных накопителей) твердотельные накопители следовали за частотой отказов жестких дисков с течением времени, хотя и с немного более низким показателем AFR. Но было неясно, будет ли частота отказов когорты твердотельных накопителей по-прежнему соответствовать частоте отказов жестких дисков, сгладится или окажется где-то посередине.

Теперь, когда у нас есть данные еще за один год, ответ кажется очевидным, как показано на приведенной ниже диаграмме, которая основана на данных за второй квартал 2022 года и дает нам данные SSD за 5-й год.


И победителем становится…
На данный момент мы можем обоснованно утверждать, что твердотельные накопители более надежны, чем жесткие диски, по крайней мере, при использовании в качестве загрузочных дисков в нашей среде. Это подтверждает анекдотические истории и обоснованные предположения, сделанные нашими читателями за последний год или около того. Отличная работа.

Мы будем продолжать собирать и представлять данные SSD на регулярной основе, чтобы подтвердить эти выводы и посмотреть, что будет дальше. Совершенно очевидно, что частота отказов твердотельных накопителей в конечном итоге начнет расти. Также возможно, что в какой-то момент твердотельные накопители могут удариться о стену, возможно, когда они начнут достигать своих пределов износа носителя. К этому моменту в ближайшие месяцы мы рассмотрим статистику SMART для наших твердотельных накопителей и посмотрим, как они связаны с отказом диска. У нас также есть некоторая собственная неподтвержденная информация, которую мы попытаемся подтвердить о том, насколько далеко за пределами износа носителя вы можете продвигать SSD. Следите за обновлениями.

Данные статистики SSD
Данные, собранные и проанализированные для этого обзора, доступны на нашей странице данных тестирования жесткого диска. Вы найдете данные SSD и HDD в одних и тех же файлах, и вам придется использовать номер модели, чтобы найти нужные диски, поскольку нет поля для обозначения диска как SSD или HDD. Вы можете скачать и использовать эти данные бесплатно в своих целях. Все, что мы просим, ​​это три вещи: 1) вы указываете Backblaze в качестве источника, если вы используете данные, 2) вы соглашаетесь с тем, что несете единоличную ответственность за то, как вы используете данные, и 3) вы никому не продаете эти данные — они бесплатно.

Вы также можете загрузить данные Backblaze Drive Stats через репозиторий SNIA IOTTA Trace Repository, если это необходимо. Те же данные; вам просто нужно соблюдать перечисленные условия лицензии. Спасибо Джеффу Куеннингу и Манджари Сентилкумару за то, что они добровольно потратили свое время и умственные способности, чтобы это произошло. Потрясающая работа.

Удачи и дайте нам знать, если вы найдете что-нибудь интересное.

Статистика Backblaze Drive за второй квартал 2022 года



На конец второго квартала 2022 года Backblaze отслеживала 219 444 жестких диска и твердотельных накопителя в наших центрах обработки данных по всему миру. Из этого числа 4020 — загрузочные диски, 2558 — твердотельные накопители и 1462 — жесткие диски. Позднее в этом квартале мы пересмотрим нашу коллекцию твердотельных накопителей. Сегодня мы сосредоточимся на 215 424 дисках с данными, находящихся под управлением, и проанализируем их ежеквартальную и пожизненную частоту отказов по состоянию на конец второго квартала 2022 года., мы надеемся, что вы сделаете то же самое в разделе комментариев в конце поста.

Частота отказов жестких дисков за весь срок службы
В этом отчете мы немного изменим ситуацию и начнем с частоты отказов за весь срок службы. Мы рассмотрим данные за второй квартал позже в этом посте. По состоянию на 30 июня 2022 года Backblaze отслеживала 215 424 жестких диска, используемых для хранения данных. Для нашей оценки мы исключили из рассмотрения 413 накопителей, поскольку они использовались для целей тестирования или моделей накопителей, в которых не было по крайней мере 60 дисков. Таким образом, у нас остается 215 011 жестких дисков, сгруппированных по 27 различным моделям, для анализа отчета о сроке службы.



Примечания и наблюдения о статистике жизни
Годовая частота отказов за весь срок службы для всех перечисленных выше дисков составляет 1,39%. Это то же самое, что и в прошлом квартале, и меньше, чем 1,45% год назад (30.06.2021).

Беглый взгляд вниз по столбцу годовой частоты отказов (AFR) позволяет определить три диска с самой высокой частотой отказов:
  • HGST 8 ТБ (модель: HUH728080ALE604) — 6,26%.
  • Seagate 14 ТБ (модель: ST14000NM0138) — 4,86%.
  • Toshiba 16 ТБ (модель: MG08ACA16TA на 3,57%).
Что общего между этими тремя моделями? Размер выборки, в нашем случае количество дней вождения, слишком мал, и в этих трех случаях это приводит к широкому диапазону между низкими и высокими значениями доверительного интервала. Чем шире разрыв, тем меньше мы уверены в AFR.

В таблице выше мы перечисляем все модели для полноты, но это делает диаграмму более сложной. Нам нравится упрощать, поэтому давайте удалим те модели накопителей, которые имеют широкие доверительные интервалы, и включим только общедоступные модели накопителей. Мы установим следующие параметры: разрыв 95% доверительного интервала 0,5% или меньше, минимальное значение дней вождения равное одному миллиону, чтобы обеспечить достаточно большой размер выборки, и модели дисков размером 8 ТБ или более. Упрощенная схема приведена ниже.


Подводя итог, можно сказать, что в нашей среде мы на 95 % уверены, что значение AFR, указанное для каждой модели привода, находится между значениями нижнего и верхнего доверительного интервала.

Вычисление годовой частоты отказов
Мы используем термин годовая частота отказов, или AFR, в наших отчетах Drive Stats. Давайте потратим минуту, чтобы объяснить, как мы рассчитываем значение AFR и почему мы делаем это именно так. Формула для данной когорты драйвов:
AFR = (диск_ошибок/(драйв_дней/365)) * 100
Определим используемые термины:
  • Когорта дисков: выбранный набор дисков (обычно по моделям) за определенный период времени (квартал, год, срок службы).
  • AFR: годовая частота отказов, которая применяется к выбранной группе дисков.
  • drive_failures: количество отказавших дисков для выбранной когорты дисков.
  • drive_days: количество дней, в течение которых все диски в выбранной когорте работают в течение определенного периода времени когорты (т. е. квартал, год, срок службы).
Например, для диска Seagate емкостью 16 ТБ в приведенной выше таблице мы подсчитали, что за время жизни этой конкретной когорты дисков произошло 117 отказов дисков и 4 117 553 дня работы. AFR рассчитывается следующим образом:
AFR = (117 / (4 117 553 / 365)) * 100 = 1,04%
Почему мы не используем счетчик дисков?
Наша среда очень динамична, когда речь идет о входе и выходе дисков из системы; диск HGST на 12 ТБ выходит из строя и заменяется Seagate на 12 ТБ, добавляется новое хранилище Backblaze Vault и добавляются 1200 новых дисков Toshiba на 14 ТБ, хранилище дисков Backblaze Vault на 4 ТБ выводится из эксплуатации и т. д. Использование подсчета приводов проблематично, поскольку предполагает стабильное количество приводов в когорте в течение периода наблюдения. Да, мы признаем, что с достаточным количеством математики вы можете сделать эту работу, но вместо того, чтобы возвращаться к колледжу, мы делаем это проще и используем дни поездок, поскольку они учитывают потенциальное изменение количества поездок в течение периода наблюдения и распределяют каждый вклад привода соответственно.

Для полноты картины давайте рассчитаем AFR для диска Seagate емкостью 16 ТБ, используя формулу, основанную на подсчете дисков, учитывая, что было 16 860 дисков и 117 отказов.
Количество дисков AFR = (117 / 16 860) * 100 = 0,69%
Хотя количество дисков AFR намного ниже, предположение о том, что все 16 860 дисков присутствовали в течение всего периода наблюдения (срок службы), неверно. За последний квартал мы добавили 3 601 новый диск, а за последний год добавили 12 003 новых диска. Тем не менее, все они были засчитаны, как если бы они были установлены в первый день. Другими словами, использование AFR для подсчета дисков в нашем случае искажает частоту отказов дисков в нашей среде.

Как мы определяем неисправность диска
Сегодня мы разделяем отказы дисков на две категории: реактивные и упреждающие. Реактивные сбои — это когда диск вышел из строя и не может или не может взаимодействовать с нашей системой. Упреждающие сбои — это когда сбой неизбежен на основании ошибок, о которых сообщает диск, которые подтверждаются проверкой статистики SMART диска. В этом случае диск извлекается до того, как он полностью выйдет из строя.

За последние несколько лет исследователи данных использовали собранные нами статистические данные SMART, чтобы выяснить, могут ли они предсказать отказ диска с использованием различных статистических методологий, а в последнее время — методов искусственного интеллекта и машинного обучения. Способность точно предсказать отказ диска с минимальным количеством ложных срабатываний оптимизирует наши операционные возможности по мере масштабирования нашей платформы хранения.

СМАРТ-статистика
SMART означает технологию самоконтроля, анализа и отчетности и представляет собой систему мониторинга, включенную в жесткие диски, которая сообщает о различных атрибутах состояния данного диска. Каждый день Backblaze записывает и сохраняет статистику SMART с жестких дисков в наших центрах обработки данных. Прочтите этот пост, чтобы узнать больше о статистике SMART и о том, как мы ее используем.

Частота отказов жестких дисков за второй квартал 2022 г.
Для ежеквартального отчета за второй квартал 2022 года мы отследили 215 011 жестких дисков с разбивкой по моделям дисков на 27 различных групп, используя только данные за второй квартал. В таблице ниже перечислены данные для каждой из этих моделей дисков.



Примечания и наблюдения по статистике за второй квартал 2022 года
Срочные новости, OG спотыкается: диски Seagate емкостью 6 ТБ (модель: ST6000DX000) наконец-то потерпели неудачу в этом квартале — на самом деле, две поломки. Учитывая, что это самая старая модель привода в нашем автопарке со средним возрастом 86,7 месяца эксплуатации, ожидается одна-две поломки. Тем не менее, это был первый сбой этой модели накопителя с третьего квартала прошлого года. Мы можем ожидать, что в какой-то момент в будущем эти накопители будут выведены из эксплуатации, но их показатель AFR за весь срок службы составляет всего 0,87%, поэтому они не являются первыми в очереди.

Еще один ноль для следующей OG: следующая старейшая когорта дисков в нашей коллекции, диски Toshiba емкостью 4 ТБ (модель: MD04ABA400V) за 85,3 месяца, не имела ни одного сбоя во втором квартале. Последний сбой был зарегистрирован год назад, во втором квартале 2021 года. Их AFR за время жизни составляет всего 0,79%, хотя разрыв их доверительного интервала за время жизни составляет 1,3%, что, как мы видели, означает, что нам не хватает данных, чтобы быть по-настоящему уверенными в числе AFR.. Тем не менее, при одном сбое в год они могли бы прослужить еще 97 лет — скорее всего, нет.

Больше нулей во втором квартале: в этом квартале три других накопителя не имели сбоев: HGST 8 ТБ (модель: HUH728080ALE604), Toshiba 14 ТБ (модель: MG07ACA14TEY) и Toshiba 16 ТБ (модель: MG08ACA16TA). Как и в случае с Toshiba емкостью 4 ТБ, упомянутой выше, эти диски имеют очень большие разрывы доверительного интервала, обусловленные ограниченным количеством точек данных. Например, у Toshiba емкостью 16 ТБ было больше всех дней работы — 32 064 — среди всех этих моделей накопителей. Нам потребуется не менее 500 000 дней вождения в квартале, чтобы получить доверительный интервал 95%. Тем не менее, вполне возможно, что какой-либо из этих дисков или все они продолжат показывать отличные результаты в ближайшие кварталы, просто мы пока не уверены на 95%.

Работает на выхлопе: диски Seagate емкостью 4 ТБ (модель: ST4000DM000) начинают показывать свой возраст, в среднем 80,3 месяца. Их ежеквартальная частота отказов увеличивалась в каждом из последних четырех кварталов до 3,42% в этом квартале. Мы развернули нашу программу клонирования для этих дисков в рамках нашей программы обеспечения надежности данных, и в течение следующих нескольких месяцев эти диски будут выведены из эксплуатации. Они хорошо послужили нам, но, похоже, они устали после почти семи лет постоянного вращения.

AFR снова увеличивается: во втором квартале AFR увеличился до 1,46% для всех моделей дисков вместе взятых. Это на 1,22% больше, чем в первом квартале 2022 года, и на 1,01% год назад, во втором квартале 2021 года. Стареющие диски Seagate емкостью 4 ТБ являются частью увеличения, но частота отказов дисков Toshiba и HGST также увеличилась за последнее время. год. По-видимому, это связано со старением всего парка приводов, и мы ожидаем, что это число уменьшится по мере вывода из эксплуатации старых приводов в течение следующего года.

Четыре тысячи серверов хранения
В первом абзаце мы отметили наличие 4020 загрузочных дисков. Что может быть неочевидным, так это то, что это соответствует 4020 серверам хранения. Это серверы 4U с 45 или 60 дисками в каждом с дисками размером от 4 ТБ до 16 ТБ. Наименьший размер составляет 180 ТБ (45 дисков по 4 ТБ), а самый большой — 960 ТБ (60 дисков по 16 ТБ). Эти серверы представляют собой сочетание модулей хранения Backblaze и сторонних серверов хранения. Прошло много времени с момента нашего последнего обновления Storage Pod, так что ищите что-нибудь в конце третьего или начале четвертого квартала.

Статистика привода на DEFCON
Если вы будете на DEFCON 30 в Лас-Вегасе, я буду выступать в прямом эфире в Data Duplication Village (DDV) в 13:00. в пятницу, 12 августа. Полностью волонтерский DDV расположен на нижнем уровне административного конференц-центра отеля Flamingo. Мы будем говорить о статистике дисков, твердотельных накопителях, ожидаемом сроке службы дисков, статистике SMART и многом другом. Я надеюсь увидеть вас там.

Данные статистики жесткого диска
Полный набор данных, использованных для создания информации, используемой в этом обзоре, доступен на нашей странице данных тестирования жесткого диска. Вы можете скачать и использовать эти данные бесплатно в своих целях. Все, что мы просим, это три вещи: 1) вы указываете Backblaze в качестве источника, если вы используете данные, 2) вы соглашаетесь с тем, что вы несете единоличную ответственность за то, как вы используете данные, и 3) вы никому не продаете эти данные; это свободно.

Если вам нужны таблицы и диаграммы, используемые в этом отчете, вы можете загрузить файл .zip из облачного хранилища Backblaze B2, который содержит файлы .jpg и/или .xlsx, если применимо.
Удачи и дайте нам знать, если вы найдете что-нибудь интересное.

Статистика Backblaze Drive за первый квартал 2022 года

Давным-давно в далекой-далекой галактике Backblaze начала собирать и хранить статистику о жестких дисках, которые она использует для хранения данных о клиентах. По состоянию на конец первого квартала 2022 года Backblaze отслеживала 211 732 жестких диска и твердотельных накопителя в наших центрах обработки данных по всему миру. Из этого числа было 3860 загрузочных дисков, в результате чего под управлением осталось 207 872 диска с данными. В этом отчете основное внимание будет уделено этим дискам данных. Мы рассмотрим частоту отказов жестких дисков для тех моделей дисков, которые были активны на конец первого квартала 2022 года, а также рассмотрим статистику их отказов за весь срок службы. В промежутках мы углубимся в частоту отказов моделей активных дисков с течением времени. Попутно мы будем делиться своими наблюдениями и выводами о представленных данных и, как всегда, надеемся, что вы сделаете то же самое в разделе комментариев в конце отчета.

«Величайший учитель — это неудача»
По состоянию на конец первого квартала 2022 года Backblaze отслеживала 207 872 жестких диска, используемых для хранения данных. Для нашей оценки мы исключили из рассмотрения 394 накопителя, так как они либо использовались в целях тестирования, либо были моделями накопителей, в которых не было по крайней мере 60 активных дисков. Это оставляет нам 207 478 жестких дисков для анализа для этого отчета. На приведенной ниже диаграмме представлены результаты нашего анализа за первый квартал 2022 года.



«Всегда передавайте то, чему вы научились».
При рассмотрении приведенной выше таблицы за первый квартал 2022 года и данных, которые находятся под ней, мы предлагаем несколько наблюдений и предостережений:
  • «С этой моделью Сила сильна». Компьютер Seagate емкостью 6 ТБ (модель: ST6000DX000) продолжает бросать вызов времени и не дал ни одного сбоя в первом квартале 2022 года, несмотря на то, что его средний возраст составляет почти семь лет (83,7 месяца). 98% дисков (859) были установлены в течение того же двухнедельного периода в первом квартале 2015 года. Самому младшему диску емкостью 6 ТБ во всей когорте чуть больше четырех лет. Toshiba емкостью 4 ТБ (модель: MD04ABA400V) также не имела сбоев в первом квартале 2022 года, а средний возраст (82,3 месяца) почти такой же, как и у дисков Seagate, но группа Toshiba насчитывает всего 97 дисков. Тем не менее, в течение всего срока службы Backblaze у них в среднем происходит только один отказ диска в год.
  • «Отлично, малыш, не будь самоуверенным». В первом квартале 2022 года было несколько накопителей падаван (в среднем возрасте), у которых также не было сбоев. движения со средним возрастом 5,9 и 1,5 месяца соответственно. Между двумя моделями имеется 3899 рабочих дисков и только один вышел из строя с тех пор, как они были установлены шесть месяцев назад. Хорошее начало, но, конечно, еще не территория джедаев.
  • «Меня беспокоит ваше недоверие». Возможно, вы заметили, что AFR за первый квартал 2022 г. составил 24,31% для дисков HGST емкостью 8 ТБ (модель: HUH728080ALE604). Диски молодые, средний возраст составляет два месяца, и всего 76 дисков с общим пробегом 4504 дня. Если вы находите AFR надоедливым, я на самом деле нахожу ваше недоверие тревожным, учитывая историю звездной производительности в других приводах HGST, которые мы используем. Посмотрим, где мы находимся через пару кварталов.
  • «Стараюсь не. Делать или не делать. Нет никакой попытки».6 Эпоха продолжается с дисками Seagate емкостью 14 ТБ (модель: ST14000NM0138). Когда мы в последний раз видели этот диск, альянс Seagate/Dell/Backblaze продолжал усердно работать над тем, чтобы понять, почему частота отказов остается неизменно высокой. Это необычно для этой модели, и за последние несколько месяцев команда использовала несколько настроек прошивки с разной степенью успеха. Терпение.
  • «Мне нравятся первые. Хорошие они или плохие, они всегда запоминаются».
Мы предоставляем ежеквартальные и годовые отчеты Drive Stats с первого квартала 2015 года. Попутно мы представили несколько различных представлений данных, чтобы помочь получить представление о нашей операционной среде и жестких дисках в этой среде. Сегодня мы хотели бы предложить другой способ визуализации сравнения среднего возраста многих различных моделей, которые мы в настоящее время используем, с годовой частотой отказов каждой из этих моделей накопителей: Квадрат отказов статистики привода:


«…многие истины, за которые мы цепляемся, зависят от нашей точки зрения».
Каждая точка на квадрате отказов статистики накопителя представляет модель жесткого диска, работающую в нашей среде по состоянию на 31 марта 2022 г., и находится на пересечении среднего возраста этой модели и годовой частоты отказов этой модели. Мы включили только модели накопителей с общим сроком службы в один миллион дней работы или с доверительным интервалом для всех включенных моделей накопителей, равным 0,6 или меньше.

Полученная диаграмма разделена на четыре равных квадранта, которые мы классифицируем следующим образом:
  • Квадрант I: пенсионеры. Диски в этом квадранте показали себя хорошо, но, учитывая их нынешний высокий уровень AFR, они первыми в очереди на замену.
  • Квадрант II: Победители. Приводы в этом квадранте зарекомендовали себя как надежные с течением времени. Учитывая их возраст, нам нужно начать планировать их замену, но не нужно паниковать.
  • Квадрант III: Претенденты. Приводы в этом квадранте стартовали с правильной ноги и не представляют никаких текущих проблем с заменой. Мы продолжим следить за этими моделями дисков, чтобы убедиться, что они остаются на пути к квадранту победителей, а не соскальзывают в квадрант IV.
  • Квадрант IV: Растяпы. Диски в этом квадранте должны быть заменены, если это возможно, но они могут продолжать работать, если интенсивность их отказов остается на текущем уровне. Избыточность и надежность, встроенные в платформу Backblaze, защищают данные от более высокой частоты отказов дисков в этом квадранте. Тем не менее, эти диски истощают центр обработки данных и операционные ресурсы.

«Трудно увидеть; будущее всегда в движении».
Очевидно, что квадрант победителей является желаемым результатом для всех моделей побуждений, которые мы используем. Но каждое стремление в основном начинается либо в квадранте III, либо в квадранте IV и перемещается оттуда с течением времени. На приведенной ниже диаграмме показано, как туда попали модели приводов из квадранта II (победители).


«Ваше внимание определяет вашу реальность».
Каждая модель привода представлена ​​змеевидной линией (Змеи на самолете!?), которая показывает AFR модели привода по мере того, как средний возраст парка увеличивается с течением времени. Интересно, что у каждой из шести моделей, находящихся в настоящее время в квадранте II, своя предыстория. Например, кто мог предсказать, что накопитель Seagate емкостью 6 ТБ (модель: ST6000DX000) окажется в квадранте победителей, учитывая его менее чем благоприятный старт в 2015 году. И этот накопитель не был единственным; диски Seagate емкостью 8 ТБ (модели: ST8000NM0055 и ST8000DM002) показали такое же поведение.

Эта диаграмма также может дать нам визуальное представление о направлении годовой частоты отказов с течением времени для данной модели привода. Например, накопитель Seagate емкостью 10 ТБ кажется более заинтересованным в переходе в квадрант пенсионеров в течение следующего квартала или около того, и поэтому приоритет его замены может быть увеличен.

«По моему опыту, удачи не бывает».
В квартальной таблице Drive Stats в начале этого отчета присутствует элемент случайности, который может повлиять на результаты. Например, сообщается ли о сбое диска 31 марта в 23:59. или в 00:01 1 апреля может незначительно повлиять на результаты. Тем не менее, ежеквартальные результаты полезны для выявления непредвиденных закономерностей частоты отказов, но наиболее точная информация о конкретной модели накопителя содержится в годовых показателях отказов за весь срок службы.

На приведенной ниже диаграмме показана годовая частота отказов за весь срок службы всех моделей накопителей, находящихся в производстве по состоянию на 31 марта 2022 года.


«Ты подвел меня в последний раз…»
Годовая частота отказов за весь срок службы для всех перечисленных выше дисков составляет 1,39%. Это меньше, чем 1,40% в конце 2021 года. Год назад (31.03.2021) AFR за весь срок службы составлял 1,49%.

При рассмотрении вышеприведенной таблицы отказов за весь срок службы любые модели накопителей с пробегом менее 500 000 дней или доверительным интервалом более 1,0 % не содержат достаточно данных, чтобы их можно было считать точным отображением их производительности в нашей среде. Хорошими примерами таких дисков являются диски HGST емкостью 8 ТБ (модель: HUH728080ALE604) и диски Toshiba емкостью 16 ТБ (модель: MG08ACA16TA). Мы перечисляем эти диски для полноты, поскольку они также перечислены в квартальной таблице в начале этого обзора.

С учетом приведенных выше критериев, касающихся дней вождения и доверительных интервалов, лучшим приводом в нашей среде для каждого производителя является:
  • HGST: 12 ТБ, модель: HUH721212ALE600. АФР: 0,33%
  • Seagate: модель на 12 ТБ: ST12000NM001G. АФР 0,63%
  • WDC: модель 14 ТБ: WUH721414ALE6L4. АФР: 0,33%
  • Toshiba: модель на 16 ТБ: MG08ACA16TEY. АФР 0,70%
«Я никогда не задаю этот вопрос, пока не сделаю это!»
Для тех из вас, кто интересуется тем, как мы готовим этот отчет, данные, которые мы использовали, доступны на нашей веб-странице данных тестирования жесткого диска. Вы можете скачать и использовать эти данные бесплатно в своих целях. Все, что мы просим, ​​это три вещи: 1) вы указываете Backblaze в качестве источника, если вы используете данные, 2) вы соглашаетесь с тем, что несете единоличную ответственность за то, как вы используете данные, и 3) вы никому не продаете сами данные; это свободно.

Удачи и дайте нам знать, если вы найдете что-нибудь интересное. И нет, это не ловушка.

Цитаты, на которые ссылаются
  • «Величайший учитель — это неудача», — Йода, «Последние джедаи».
  • «Всегда передавайте то, что вы узнали», — Йода, «Возвращение джедая».
  • «С этим сильна Сила», — Дарт Вейдер, «Новая надежда».
  • «Отлично, малыш, не будь самоуверенным», — Хан Соло, «Новая надежда».
  • «Меня беспокоит ваше отсутствие веры» — Дарт Вейдер, «Новая надежда».
  • »Стараюсь не. Делать или не делать. Нет никакой попытки», — Йода, «Империя наносит ответный удар».
  • «Мне нравятся первые. Хорошие они или плохие, они всегда запоминаются», — Асока Тано, «Мандалорец».
  • «…многие истины, за которые мы цепляемся, зависят от нашей точки зрения», — Оби-Ван Кеноби, «Возвращение джедая».
  • «Трудно увидеть; будущее всегда в движении», — Йода, «Империя наносит ответный удар».
  • «Ваше внимание определяет вашу реальность», — Куай-Гон Джинн, «Скрытая угроза».
  • «По моему опыту, удачи не бывает», — Оби-Ван Кеноби, «Новая надежда».
  • «Ты подвел меня в последний раз…» — Дарт Вейдер, «Империя наносит ответный удар»
  • «Я никогда не задаю этот вопрос, пока не сделаю это!» — Хан Соло, «Пробуждение силы».

Версия SSD: обзор статистики накопителей за 2021



Добро пожаловать в первую версию отчета Backblaze Drive Stats о твердотельных накопителях. Этот выпуск будет посвящен исключительно нашим твердотельным накопителям, в отличие от наших ежеквартальных и годовых отчетов Drive Stats, которые до прошлого года были сосредоточены исключительно на жестких дисках. Первоначально мы планируем публиковать издание SSD два раза в год, хотя это может измениться в зависимости от его ценности для наших читателей. Мы продолжим ежеквартально публиковать отчеты о статистике жестких дисков.

Задний план
Все твердотельные накопители в этом отчете являются загрузочными дисками на наших серверах хранения. В наших ранних серверах хранения мы использовали жесткие диски исключительно в качестве загрузочных дисков. Мы начали использовать твердотельные накопители в этом качестве в четвертом квартале 2018 года. С тех пор твердотельные накопители были установлены на всех новых серверах хранения и на всех серверах с неисправными загрузочными жесткими дисками. Загрузочные диски в нашей среде не только загружают серверы хранения, но и хранят файлы журналов и временные файлы, созданные сервером хранения. Каждый день загрузочный диск будет читать, записывать и удалять файлы в зависимости от активности самого сервера хранения.

Обзор
По состоянию на 31 декабря 2021 г. мы использовали 2200 твердотельных накопителей. Поскольку ниже мы делимся различными таблицами и диаграммами, некоторые цифры, особенно годовая частота отказов (AFR), будут очень неожиданными для информированных читателей. Например, ваше внимание может привлечь AFR 43,22%. Мы объясним эти выбросы по ходу дела. Большинство из них связано с новизной диска, но мы сообщим вам об этом.

Как и в случае с отчетами о жестких дисках, мы опубликовали данные, которые использовали для разработки нашего отчета о твердотельных накопителях. Фактически, мы всегда публиковали эти данные, поскольку они находятся в тех же файлах, что и данные жесткого диска. Теперь о плохих новостях: данные в настоящее время не включают тип накопителя, SDD или HDD, поэтому вам придется провести исследование по номеру модели. Извиняюсь. Вы найдете ссылки для загрузки файлов данных на нашей веб-странице данных тестов Drive Stats. Если вы просто ищете данные SSD, начните с Q4 2018 и продолжайте.

Если вы не знакомы с нашими отчетами Drive Stats, вы можете задаться вопросом, почему мы собираем и передаем эту информацию. Это начинается с того факта, что у нас есть много доступного хранилища данных, более двух эксабайт на сегодняшний день, для клиентов, использующих Backblaze B2 Cloud Storage и Backblaze Computer Backup. При этом нам необходимо иметь глубокое понимание нашей среды, одним из аспектов которой является то, как часто диски, как жесткие, так и твердотельные, выходят из строя. Примерно семь лет назад мы решили поделиться тем, что узнали, и пролить свет на ранее непрозрачный мир частоты отказов жестких дисков. Вполне естественно, что мы будем столь же прозрачны с SSD. Читать дальше.

Годовая частота отказов твердотельных накопителей за 2019, 2020 и 2021 годы
В конце 2021 года в наших серверах хранения было 2200 твердотельных накопителей, что выросло с нуля в третьем квартале 2018 года. Мы начнем с анализа AFR за последние три года, затем углубимся в частоту отказов в 2021 году и, наконец, возьмем посмотрите на ежемесячные ставки AFR с 2019 года. Мы объясним каждый по ходу дела.

На приведенной ниже диаграмме показаны показатели отказов за 2019, 2020 и 2021 годы.


Наблюдения и комментарии
Данные за каждый год (2019, 2020 и 2021) включают деятельность, имевшую место в этом году.
В 2021 году частота отказов имеет тенденцию к увеличению. Мы видели это, когда сравнивали наши загрузочные диски HDD и SSD в предыдущем посте. Когда мы перейдем к квартальному графику позже в этом сообщении блога, эта тенденция как таковая будет намного яснее.
У двух дисков сногсшибательная частота отказов — модель Crucial: CT250MX500SSD1 и модель Seagate: ZA2000CM10002. В обоих случаях количество дней вождения и количество поездок (не показано) очень мало. Для Crucial установлено всего 20 дисков, которые были установлены в декабре 2021 года. Для Seagate было всего четыре диска, и один вышел из строя в начале 2021 года. В обоих случаях AFR основан на очень небольшом количестве данных, что приводит к очень широкий доверительный интервал, который мы увидим в следующем разделе. Мы включаем эти диски для полноты картины.
День вождения означает один привод в эксплуатации в течение одного дня. Следовательно, один привод в эксплуатации в 2021 году будет иметь 365 дней вождения. Если диск выйдет из строя через 200 дней, он будет иметь 200 дней работы и будет помечен как неисправный. Для данной когорты дисков за указанный период времени мы вычисляем AFR следующим образом:
AFR = (сбои диска / (дни привода / 365)) * 100
Это обеспечивает годовую частоту отказов (AFR) за любой период времени.
Ежегодная частота отказов твердотельных накопителей за 2021 г.
Давайте углубимся в 2021 год и добавим еще несколько деталей. Таблица ниже представляет собой расширенную версию годового раздела за 2021 год из предыдущей диаграммы.


Из таблицы должно быть ясно, что для дисков Crucial и Seagate с двузначным значением AFR требуется намного больше данных, прежде чем можно будет судить об их надежности в нашей среде. Об этом свидетельствует чрезвычайно широкий доверительный интервал для каждого диска. Приемлемый доверительный интервал составляет менее 1,0%, при этом оптимальным для нас является 0,6% или менее. Только модель Seagate: ZA250CM10002 соответствует критерию 1,0%, хотя модель Seagate: ZA250CM10003 очень близка.

Очевидно, что требуется время, чтобы собрать достаточно данных, чтобы быть уверенным, что рассматриваемый диск работает на ожидаемом уровне. В нашем случае мы ожидаем AFR от 1% до 2%. Все, что меньше, отлично, а все, что больше, заслуживает внимания. Один из способов, которым мы «наблюдаем», — отслеживание квартальных результатов, которые мы рассмотрим далее.

Ежеквартальные показатели отказов твердотельных накопителей с течением времени
Есть два разных способа взглянуть на квартальные данные: за дискретные периоды времени, например квартал или год; или кумулятивно за определенный период времени, например, все данные с 2018 года. Данные, охватывающие квартал за кварталом, могут быть неустойчивыми или резкими, но быстро реагируют на изменения. Совокупные данные показывают долгосрочные тенденции, но менее чувствительны к быстрым изменениям.

Ниже приведены графики как поквартальных, так и совокупных поквартальных данных для наших твердотельных накопителей, начиная с первого квартала 2019 года. Сначала мы сравним все твердотельные накопители, а затем рассмотрим несколько отдельных интересующих дисков.


Совокупная кривая плавно перетекает ниже порогового значения AFR в 2%, вызывающего озабоченность. Если бы мы просто следили за квартальным значением, мы могли бы счесть использование твердотельных накопителей в качестве загрузочных дисков проблематичным, поскольку в нескольких кварталах показатель AFR был на уровне 3% или около него. Тем не менее, чем больше данных, тем лучше, и по мере старения твердотельных накопителей мы хотим быть еще более бдительными, чтобы увидеть, как долго они прослужат. У нас есть много данных по этой теме для жестких дисков, но мы все еще изучаем SDD.

Имея это в виду, давайте взглянем на три старых твердотельных накопителя, чтобы увидеть, есть ли что-нибудь интересное на данный момент.


Наблюдения и комментарии
За весь 2021 год совокупный показатель AFR для всех трех дисков был ниже 1%.
Это сопоставимо с совокупным AFR для всех SSD-накопителей по состоянию на четвертый квартал 2021 года, который составил 1,07% (по сравнению с предыдущим графиком).
Продолжая сравнение, совокупный (срок службы) AFR для наших жестких дисков составил 1,40%, как указано в нашем отчете о статистике дисков за 2021 год. Но, как мы отметили в нашем сравнении жестких дисков и твердотельных накопителей, две группы (твердотельные и жесткие диски) находятся в разных точках своего жизненного цикла. Как и было обещано, мы продолжим изучать эту дихотомию в ближайшие месяцы.
Модель (ZA250CM10002), представленная красной линией, похоже, следует классической кривой отказов ванны, испытывая ранние отказы, прежде чем установится до значения AFR ниже 1%. С другой стороны, два других диска не показывали признаков преждевременного выхода из строя и начали выходить из строя совсем недавно. Этот тип отказов аналогичен тому, который демонстрируют наши жесткие диски, которые больше не соответствуют модели кривой ванны.

Эксперименты и тест-драйвы
Если вы решите загрузить данные и покопаться, вы увидите несколько аномалий, связанных с моделями SSD. Мы хотели бы пролить свет на эти выбросы, прежде чем вы начнете ковыряться. Мы уже рассмотрели диски Crucial и Seagate с более высокими, чем ожидалось, показателями AFR, но есть еще две модели твердотельных накопителей, которые не фигурируют в этом отчете, но фигурируют в данных. Это Samsung 850 EVO 1 ТБ и HP SSD S700 250 ГБ.

Почему они не отображаются в этом отчете? Как и в случае с нашим обзором статистики дисков для наших жестких дисков, мы удаляем те диски, которые мы используем для целей тестирования. Вот подробности:

Твердотельные накопители Samsung были первыми твердотельными накопителями, которые устанавливались в качестве загрузочных дисков. Было установлено 10 дисков, чтобы проверить, как SSD будут работать в качестве загрузочных дисков. Недурно! У нас были предварительные планы на эти 10 дисков на других серверах, и примерно через две недели диски Samsung были заменены другими твердотельными накопителями и развернуты по их первоначальному назначению. Их новаторская работа была отражена в данных Drive Stats для потомков.
Твердотельные накопители HP, которые были частью тестирования нашей внутренней платформы переноса данных, т. е. переноса данных с меньших дисков на большие. Эти диски фигурировали в данных за третий и четвертый кварталы 2021 года. Любые данные, относящиеся к этим дискам в третьем или четвертом квартале, не основаны на использовании этих дисков в нашей производственной среде.

Что дальше
Мы признаем, что 2200 твердотельных накопителей — это относительно небольшое количество дисков, на которых можно проводить наш анализ, и хотя это число приводит к более широким, чем хотелось бы, доверительным интервалам, нам нужно было с чего-то начинать. Разумеется, мы продолжим добавлять в исследуемую группу загрузочные SSD-накопители, что повысит достоверность представляемых данных. Кроме того, мы ожидаем, что наши читатели оценят представленные данные со своей обычной скептической точки зрения и помогут нам сделать этот отчет еще более информативным и полезным.

У нас есть твердотельные накопители на других типах серверов в нашей среде. Например, серверы восстановления, служебные серверы, серверы API и т. д. Мы рассматриваем возможность оснащения дисков на некоторых из этих серверов, чтобы они могли сообщать о своей статистике так же, как наши загрузочные диски. Есть несколько соображений, прежде чем мы это сделаем:

Мы не влияем на производительность других серверов.
Мы понимаем, что рабочая нагрузка дисков на каждом из других серверов, скорее всего, разная. Это означает, что мы можем получить несколько когорт SSD-накопителей с разными рабочими нагрузками, которые могут быть или не быть подходящими для нашего анализа.
Мы не хотим влиять на производительность наших технических специалистов в центрах обработки данных, добавляя дополнительные или конфликтующие шаги в процессы, которые они используют при обслуживании этих других серверов.

Данные статистики SSD
Полный набор данных, использованных для создания информации, используемой в этом обзоре, доступен на нашей странице данных тестирования жесткого диска. Как отмечалось ранее, вы найдете данные SSD и HDD в одних и тех же файлах, и вам придется использовать номер модели, чтобы отличить одну запись от другой. Вы можете скачать и использовать эти данные бесплатно в своих целях. Все, что мы просим, ​​это три вещи: 1) вы указываете Backblaze в качестве источника, если вы используете данные, 2) вы соглашаетесь с тем, что вы несете единоличную ответственность за то, как вы используете данные, и 3) вы никому не продаете эти данные; это бесплатно.