Рейтинг
0.00

Backblaze Хостинг

2 читателя, 75 топиков

Backblaze Drive Stats for 2023

По состоянию на 31 декабря 2023 г. под нашим управлением находилось 274 622 накопителя. Из этого числа было 4400 загрузочных дисков и 270 222 диска с данными. Этот отчет будет посвящен нашим дискам с данными. Мы рассмотрим частоту отказов жестких дисков в 2023 году, сравним эти показатели с предыдущими годами и представим статистику отказов за весь срок службы для всех моделей жестких дисков, действующих в нашем центре обработки данных по состоянию на конец 2023 года. Попутно мы делимся своими наблюдениями и понимание представленных данных, и, как всегда, мы с нетерпением ждем, когда вы сделаете то же самое в разделе комментариев в конце публикации.

Частота отказов жестких дисков в 2023 году
По состоянию на конец 2023 года Backblaze отслеживала 270 222 жестких диска, используемых для хранения данных. Для нашей оценки мы исключили из рассмотрения 466 дисков, о которых поговорим позже. Таким образом, для анализа в этом отчете нам осталось 269 756 жестких дисков, охватывающих 35 моделей дисков. В таблице ниже показаны годовые показатели отказов (AFR) на 2023 год для этой коллекции накопителей.



Примечания и наблюдения
Один ноль за год: в 2023 году только у одной модели накопителей не было сбоев — Seagate емкостью 8 ТБ (модель: ST8000NM000A). Фактически, эта модель накопителя не имела ни одного сбоя в нашей среде с тех пор, как мы начали ее развертывание в третьем квартале 2022 года. Этот «ноль» сопровождается некоторыми оговорками: у нас в эксплуатации находится только 204 накопителя, а количество дней эксплуатации накопителя ограничено ( 52 876), но отсутствие сбоев за 18 месяцев — хорошее начало.

Сбои за год: в 2023 году вышло из строя 4189 дисков. Проделав небольшие математические расчеты, выяснилось, что в среднем за последний год мы заменяли неисправный диск каждые два часа и пять минут. Если мы ограничим количество рабочих часов до 40 в неделю, то неисправный диск будет заменяться каждые 30 минут.

Больше моделей приводов. В 2023 году мы добавили в список шесть моделей приводов, исключив из обращения ни одну, в результате чего мы отслеживаем в общей сложности 35 различных моделей.

Две модели уже какое-то время находятся в нашей среде, но к концу 2023 года их производство, наконец, достигнет 60 накопителей.
  • Toshiba 8 ТБ, модель HDWF180: 60 дисков.
  • Seagate 18 ТБ, модель ST18000NM000J: 60 дисков.
Четыре модели были новыми для нашей производственной среды, и к концу 2023 года в их производстве будет 60 или более приводов.
  • Seagate 12 ТБ, модель ST12000NM000J: 195 дисков.
  • Seagate 14 ТБ, модель ST14000NM000J: 77 дисков.
  • Seagate 14 ТБ, модель ST14000NM0018: 66 дисков.
  • WDC 22 ТБ, модель WUH722222ALE6L4: 2442 диска.
Диски трех моделей Seagate используются для замены вышедших из строя дисков емкостью 12 ТБ и 14 ТБ. Диски WDC емкостью 22 ТБ — это новая модель, добавленная в основном как два новых хранилища Backblaze Vault по 1200 дисков в каждом.

Смешивание и подбор моделей приводов
Было время, когда мы покупали дополнительные диски определенной модели, чтобы иметь под рукой замену вышедшего из строя диска диском той же модели. Например, если бы нам нужно было 1200 дисков для Backblaze Vault, мы бы купили 1300, чтобы получить 100 запасных. Со временем мы протестировали комбинации различных моделей накопителей, чтобы убедиться в отсутствии влияния на пропускную способность и производительность. Это позволило нам приобретать диски по мере необходимости, например, диски Seagate, упомянутые ранее. Это сэкономило нам средства на покупке дисков, которые простоял месяцами или годами в ожидании выхода из строя той же модели диска.

Диски, не включенные в этот обзор
Ранее мы отмечали, что из рассмотрения в этом обзоре было исключено 466 накопителей. Эти диски делятся на три категории.
  • Тестирование. Это диски определенной модели, которые мы отслеживаем и собираем данные о статистике дисков, но которые находятся в процессе квалификации как производственные диски. Например, в четвертом квартале оценивались четыре накопителя Toshiba емкостью 20 ТБ.
  • Горячие диски: это диски, которые во время работы подвергались воздействию высоких температур. Мы удалили их из этого обзора, но рассмотрим их отдельно, чтобы узнать больше о том, насколько хорошо диски выдерживают нагрев. Мы подробно рассмотрели эту тему в нашем отчете о статистике поездок за третий квартал 2023 года.
  • Менее 60 дисков: это пережиток того времени, когда мы использовали один сервер хранения из 60 дисков для хранения большого количества отправленных нам данных. Сегодня мы разделяем один и тот же объект на 20 серверов, то есть в Backblaze Vault, что значительно повышает надежность данных. В 2024 году мы собираемся пересмотреть 60 критериев вождения и, скорее всего, заменим этот стандарт минимальным количеством дней вождения за определенный период времени, чтобы стать частью пересмотра.
Тем не менее, в данных Drive Stats за четвертый квартал 2023 года вы найдете эти 466 накопителей, а также данные по 269 756 накопителям, использованным в обзоре.

Сравнение статистики поездок за 2021, 2022 и 2023 годы
В таблице ниже сравниваются AFR за каждый из последних трех лет. В таблицу включены только те модели приводов, которые в 2023 году проработали более 200 000 дней. Данные за каждый год включают в себя этот год только для действующих моделей приводов, представленных на конец каждого года. Таблица отсортирована по размеру диска, а затем по AFR.


Примечания и наблюдения
Чего не хватает? Как уже отмечалось, в 2023 году для попадания в список модели привода потребовалось бы 200 000 или более дней вождения. Такие накопители, как модель WDC емкостью 22 ТБ с 126 956 днями работы и Seagate емкостью 8 ТБ с нулевым сбоем, но только 52 876 дней работы не соответствовали требованиям. Почему 200 тысяч? Каждый квартал мы используем 50 000 дней вождения в качестве минимального числа, которое можно считать статистически значимым. Это не идеальный показатель, но он минимизирует волатильность, иногда связанную с моделями приводов с меньшим количеством дней в пути.

AFR 2023 года вырос: AFR для всех перечисленных моделей приводов составил 1,70% в 2023 году. Для сравнения: 1,37% в 2022 году и 1,01% в 2021 году. На протяжении 2023 года мы наблюдали рост AFR, поскольку средний возраст парка приводов увеличился.. В настоящее время существует девять моделей приводов со средним возрастом шесть лет и более. На эти девять моделей приходится почти 20% производимых приводов. Начиная со второго квартала, мы ускорили переход от старых моделей дисков (обычно емкостью 4 ТБ) к новым моделям дисков (обычно 16 ТБ). Эта программа будет продолжаться в течение 2024 года и далее.

Годовая частота отказов в зависимости от размера диска
Теперь давайте углубимся в цифры и посмотрим, чему еще мы можем научиться. Мы начнем с рассмотрения квартальных AFR по размеру накопителей за последние три года.



Начнем с того, что AFR для накопителей емкостью 10 ТБ (золотая линия) очевидно увеличивается, равно как и накопителей емкостью 8 ТБ (серая линия) и накопителей емкостью 12 ТБ (фиолетовая линия). Каждая из этих групп закончила с AFR 2% или выше в четвертом квартале 2023 года, а во втором квартале 2021 года стартовала с AFR около 1%. С другой стороны, AFR для накопителей емкостью 4 ТБ (синяя линия) первоначально выросла, достигнув пика в 2022 году. и с тех пор снизился. Остальные три размера дисков — 6 ТБ, 14 ТБ и 16 ТБ — колебались в пределах 1% AFR за весь период.

Уменьшив масштаб, мы можем посмотреть на изменение AFR в зависимости от размера накопителя на ежегодной основе. Если сравнить годовые результаты АФР за 2022 и 2023 годы, то получим таблицу ниже. Результаты за каждый год основаны только на данных за этот год.



На первый взгляд может показаться странным, что AFR для накопителей емкостью 4 ТБ снижается. Особенно если учесть, что средний возраст каждой из моделей накопителей емкостью 4 ТБ превышает шесть лет и продолжает стареть. Причина, вероятно, связана с тем, что в 2023 году мы сосредоточимся на переходе с дисков емкостью 4 ТБ на диски емкостью 16 ТБ. Обычно мы сначала переносим самые старые диски, то есть те, которые с большей вероятностью выйдут из строя в ближайшем будущем. Этот процесс удаления самых старых дисков, по-видимому, смягчает ожидаемый рост количества отказов по мере старения диска.

Но не все модели приводов подходят друг другу. Накопителям Seagate емкостью 6 ТБ в среднем более 8,6 лет, и к 2023 году они будут иметь самый низкий AFR для любой группы размеров дисков, что потенциально может стать насмешкой над теорией «возраст связан с отказом», по крайней мере, за последний год. Давайте посмотрим, справедливо ли это для частоты отказов наших накопителей за весь срок службы.

Статистика жесткого диска за весь срок службы
Для нашего обзора AFR за весь срок службы мы оценили 269 756 накопителей 35 моделей. В таблице ниже приведены статистические данные о сроке службы накопителей с апреля 2013 г. по конец четвертого квартала 2023 г.


Текущий срок службы AFR для всех накопителей составляет 1,46%. Это больше, чем в конце прошлого года (четвертый квартал 2022 года), который составлял 1,39%. Это имеет смысл, учитывая квартальный рост AFR в 2023 году, как было зафиксировано ранее. Это также самый высокий показатель AFR за весь срок службы с первого квартала 2021 года (1,49%).

В таблице выше указаны все модели приводов, действующие по состоянию на 31 декабря 2023 г. Чтобы разгрузить список, мы можем удалить те модели, по которым недостаточно данных, чтобы быть статистически значимыми. Это не означает, что AFR, показанный выше, неверен, это просто означает, что нам нужно больше данных, чтобы быть уверенными в частоте отказов, которую мы перечисляем. С этой целью в приведенную ниже таблицу включены только те модели накопителей, срок службы которых составляет два миллиона дней или более. Это дает нам управляемый список из 23 моделей накопителей для рассмотрения.



Используя приведенную выше таблицу, мы можем сравнить частоту отказов дисков в течение всего срока службы различных моделей дисков. На диаграммах ниже мы сгруппировали модели приводов по производителям, а затем построили график модели привода AFR в зависимости от среднего возраста в месяцах каждой модели привода. Относительный размер каждого круга представляет количество поездок в каждой когорте. Горизонтальный и вертикальный масштабы для диаграмм каждого производителя одинаковы.



Примечания и наблюдения
Миграция дисков. При выборе моделей дисков для миграции мы могли бы сначала заменить самые старые модели дисков. В данном случае диски Seagate емкостью 6 ТБ. Учитывая, что дисков всего 882 — это меньше, чем один Backblaze Vault, — влияние на частоту сбоев будет минимальным. Помимо этого, диаграмма ясно показывает, что нам следует продолжать миграцию наших дисков емкостью 4 ТБ, как мы обсуждали в нашей недавней публикации о том, какие диски находятся на каких серверах хранения. Как отмечается в этом сообщении, существуют и другие факторы, такие как возраст сервера, размер сервера (45 против 60 дисков) и частота отказов сервера, которые помогают нам принимать решения.

HGST: На графике слева ниже показана линия тренда AFR (полином второго порядка) для всех наших моделей HGST. Не похоже, что отказ диска постоянно увеличивается с возрастом. На диаграмме справа показаны те же данные с удаленными моделями дисков HGST емкостью 4 ТБ. Результаты больше соответствуют нашим ожиданиям: количество отказов дисков со временем увеличивается. Хотя диски емкостью 4 ТБ работают отлично, они, похоже, не являются эталоном AFR для новых/больших дисков.


Еще один потенциальный фактор, не рассмотренный здесь, заключается в том, что, начиная с моделей накопителей емкостью 8 ТБ, внутри накопителей использовался гелий, и диски были герметизированы. До этого они охлаждались воздухом и не были герметизированы. Так повлиял ли переход на гелий внутри накопителя на профиль отказов накопителей HGST? Интересный вопрос, но с учетом имеющихся у нас данных я не уверен, что мы сможем на него ответить – или что это имеет большое значение, поскольку гелий никуда не денется.

Seagate: На диаграмме слева ниже показана линия тренда AFR (полином второго порядка) для наших моделей Seagate. Как и в случае с моделями HGST, похоже, что количество отказов дисков с возрастом не увеличивается. Из диаграммы справа мы удалили модели накопителей старше семи лет (средний возраст).


Интересно, что линия тренда на двух графиках практически одинакова вплоть до шестилетней точки. Если мы попытаемся заглянуть в прошлое для накопителей емкостью 8 ТБ и 12 ТБ, то не получим четкого направления. Еще больше запутывает ситуацию тот факт, что все три модели, которые мы удалили, поскольку они старше семи лет, являются потребительскими моделями накопителей, а все остальные модели накопителей являются моделями накопителей корпоративного уровня. Повлияет ли это на частоту отказов корпоративных моделей накопителей, когда они прослужат семь, восемь или даже девять лет? Следите за обновлениями.

Toshiba и WDC: Что касается моделей накопителей Toshia и WDC, то имеются данные за чуть более трех лет, и никаких заметных закономерностей обнаружено не было. На сегодняшний день все накопители каждого из этих производителей работают хорошо.

Сбой диска и миграция диска
Выше мы видели одну вещь: прогнозы отказа диска обычно зависят от модели диска. Но мы не переносим модели дисков как группу, вместо этого мы переносим все диски на сервере хранения или в Backblaze Vault. Диски на данном сервере или в хранилище могут быть разных моделей. О том, как мы выбираем серверы и хранилища для миграции, будет рассказано в следующем посте, а пока мы просто скажем, что сбой диска — это еще не все.

Данные статистики жесткого диска
Полный набор данных, использованный для создания таблиц и диаграмм в этом отчете, доступен на нашей странице «Данные тестирования жесткого диска». Вы можете бесплатно скачать и использовать эти данные в своих целях. Все, что мы просим, это три вещи: 1) вы ссылаетесь на Backblaze в качестве источника, если вы используете данные, 2) вы признаете, что несете единоличную ответственность за то, как вы используете данные, и 3) вы не продаете сами эти данные кому-либо; это бесплатно.

Удачи, и дайте нам знать, если найдете что-нибудь интересное.

Статистика Backblaze Drive за третий квартал 2023

По состоянию на конец третьего квартала 2023 года Backblaze отслеживала 263 992 жестких диска (HDD) и твердотельных накопителей (SSD) в наших центрах обработки данных по всему миру. Из этого числа 4459 являются загрузочными дисками, из них 3242 — твердотельными накопителями и 1217 — жесткими дисками. Частота отказов твердотельных накопителей проанализирована в обзоре SSD Edition: 2023 Drive Stats.

В результате у нас осталось 259 533 жестких диска, на которых мы сосредоточимся в этом отчете. Мы проанализируем квартальные и за весь срок отказов накопителей данных по состоянию на конец третьего квартала 2023 года. Попутно мы поделимся своими наблюдениями и мнениями относительно представленных данных, и впервые в истории мы выявить частоту отказов дисков в разбивке по центрам обработки данных.

Уровень отказов жестких дисков в третьем квартале 2023 г.
По состоянию на конец третьего квартала 2023 года мы управляли 259 533 жесткими дисками, используемыми для хранения данных. Для нашего обзора мы исключили из рассмотрения 449 накопителей, поскольку они использовались в целях тестирования или представляли собой модели накопителей, в которых не было как минимум 60 накопителей. В результате у нас осталось 259 084 жестких диска, сгруппированных по 32 различным моделям.

В таблице ниже приведена годовая частота отказов (AFR) для этих моделей накопителей за третий квартал 2023 года.


Примечания и наблюдения по статистике за третий квартал 2023 года
  • Диски емкостью 22 ТБ находятся здесь: Внизу списка вы увидите диски WDC емкостью 22 ТБ (модель: WUH722222ALE6L4). Backblaze Vault из 1200 дисков (плюс четыре) теперь работает. 1200 накопителей были установлены 29 сентября, поэтому в этом отчете каждый из них проработал только один день, но сбоев пока нет.
  • Старики становятся смелее: на другом конце спектра срока службы находятся накопители Seagate емкостью 6 ТБ (модель: ST6000DX000) со средним сроком службы 101 месяц. В этой когорте в третьем квартале 2023 года не было сбоев при 883 дисках и сроке службы AFR 0,88%.
  • Ноль сбоев: в третьем квартале шесть различных моделей накопителей не имели сбоев в течение квартала. Но только у Seagate емкостью 6 ТБ, упомянутого выше, было более 50 000 дней работы в эксплуатации, что является нашим минимальным стандартом для обеспечения достаточного количества данных, чтобы сделать AFR правдоподобным.
  • Один сбой: в третьем квартале было зарегистрировано четыре модели приводов с одним сбоем.
После применения показателя 50 000 дней поездок выделились две поездки:
  • WDC 16 ТБ (модель: WUH721816ALE6L0) с AFR 0,15%.
  • Toshiba 14 ТБ (модель: MG07ACA14TEY) с AFR 0,63%.
Ежеквартальный показатель AFR падает
В третьем квартале 2023 года квартальный AFR для всех накопителей составил 1,47%. Это меньше, чем 2,2% во втором квартале, а также меньше, чем 1,65% год назад. Ежеквартальный AFR основан только на данных за этот квартал, поэтому он часто может колебаться от квартала к кварталу.

В нашем отчете за второй квартал 2023 года мы подозревали, что рост в 2,2% за квартал был вызван общим старением парка накопителей, и, в частности, мы указали на конкретные модели накопителей емкостью 8 ТБ, 10 ТБ и 12 ТБ как на потенциальных виновников такого роста. Этот прогноз не оправдался в третьем квартале, поскольку почти у двух третей моделей приводов показатель AFR снизился по сравнению с предыдущим кварталом по сравнению со вторым кварталом, и любое увеличение было минимальным. Сюда входили наши подозрительные модели дисков емкостью 8 ТБ, 10 ТБ и 12 ТБ.

Кажется, что второй квартал был аномалией, но в третьем квартале было одно большое отличие: мы вывели из эксплуатации 4585 устаревших дисков емкостью 4 ТБ. Средний возраст вышедших из эксплуатации накопителей составлял чуть более восьми лет, и хотя это было хорошее начало, осталось еще 28 963 накопителя емкостью 4 ТБ. Чтобы облегчить непрерывный вывод из эксплуатации устаревших дисков и сделать процесс миграции данных простым и безопасным, мы используем CVT, наше замечательное собственное программное обеспечение для миграции данных, о котором мы расскажем в другой раз.

Жаркое лето и данные статистики езды
Как и любой другой человек в нашем бизнесе, Backblaze постоянно контролирует наши системы и диски. Поэтому для нас не стало большим сюрпризом, когда ребята из НАСА подтвердили, что лето 2023 года станет самым жарким за всю историю наблюдений на Земле. Последствия этого рекордного лета отразились в наших системах мониторинга в виде предупреждений о температуре привода. Тот или иной диск на сервере хранения может перегреваться по многим причинам: он выходит из строя; вышел из строя вентилятор в сервере хранения; другие компоненты выделяют дополнительное тепло; поток воздуха каким-то образом ограничен; и так далее. Добавьте к этому тот факт, что температура окружающей среды в центре обработки данных часто повышается в летние месяцы, и вы можете получать больше предупреждений о температуре.

Просматривая данные о температуре наших накопителей в третьем квартале, мы заметили, что у небольшого количества накопителей температура превышала максимальную температуру производителя как минимум на один день. Максимальная температура для большинства накопителей составляет 60°C, за исключением накопителей Toshiba емкостью 12 ТБ, 14 ТБ и 16 ТБ, максимальная температура которых составляет 55°C. Из 259 533 дисков с данными, находившихся в эксплуатации в третьем квартале, 354 отдельных диска (0,0013%) превысили максимальную температуру производителя. Из них только два диска вышли из строя, в результате чего по состоянию на конец третьего квартала 352 диска все еще работали.

Хотя колебания температуры являются частью работы центров обработки данных, и подобные оповещения о температуре не являются чем-то необычным, команды наших центров обработки данных изучают коренные причины, чтобы убедиться, что мы готовы к неизбежному наступлению все более жаркого лета.

Повлияют ли предупреждения о температуре на статистику вождения?
Два диска, температура которых превысила максимальную температуру и вышли из строя в третьем квартале, были исключены из расчетов AFR третьего квартала. Оба диска были дисками Seagate емкостью 4 ТБ (модель: ST4000DM000). Учитывая, что оставшиеся 352 накопителя, температура которых превысила максимальную температуру, не вышли из строя в третьем квартале, мы оставили их в расчетах статистики накопителей для третьего квартала, поскольку они не увеличили вычисленную частоту отказов.

Начиная с четвертого квартала, мы удалим 352 диска из обычных расчетов AFR Drive Stats и создадим отдельную группу дисков для отслеживания, которую мы назовем Hot Drives. Это позволит нам отслеживать диски, температура которых превысила максимальную температуру, и сравнивать интенсивность их отказов с теми дисками, которые работали в соответствии со спецификациями производителя. Хотя число дисков в группе Hot Drives ограничено, это может дать нам некоторое представление о том, может ли воздействие высоких температур привести к более частому выходу диска из строя. Этот повышенный уровень мониторинга позволит выявить любое увеличение количества сбоев дисков, чтобы их можно было обнаружить и оперативно устранить.

Новые поля данных статистики поездок в третьем квартале
Во втором квартале 2023 года мы представили три новых поля данных, которые начали заполнять в публикуемых нами данных Drive Stats: vault_id, pod_id и is_legacy_format. В третьем квартале мы добавляем еще три поля в записи каждого диска следующим образом:
  • центр обработки данных: центр обработки данных Backblaze, в котором установлен диск, в настоящее время одно из следующих значений: ams5, iad1, phx1, sac0 и sac2.
  • Cluster_id: имя данной коллекции серверов хранения, логически сгруппированных для оптимизации производительности системы. Примечание. В настоящее время идентификатор кластера не всегда правильный, мы работаем над этим.
  • pod_slot_num: физическое расположение диска на сервере хранения. Конкретный слот различается в зависимости от типа и емкости сервера хранения: Backblaze (45 дисков), Backblaze (60 дисков), Dell (26 дисков) или Supermicro (60 дисков). Мы углубимся в эти различия в другом посте.
С учетом этих дополнений новая схема, начинающаяся в третьем квартале 2023 года, будет следующей:
  • дата
  • серийный номер
  • модель
  • емкость_байтов
  • отказ
  • центр обработки данных (3 квартал)
  • идентификатор_кластера (3-й квартал)
  • vault_id (2-й квартал)
  • pod_id (2-й квартал)
  • pod_slot_num (3 квартал)
  • is_legacy_format (2-й квартал)
  • smart_1_normalized
  • smart_1_raw
Остальные пары значений SMART (по данным каждой модели накопителя)
Начиная с третьего квартала, эти поля данных добавляются в общедоступные файлы статистики езды, которые мы публикуем каждый квартал.

Частота отказов по центрам обработки данных
Теперь, когда у нас есть центр обработки данных для каждого диска, мы можем вычислить AFR для дисков в каждом центре обработки данных. Ниже вы найдете AFR для каждого из пяти центров обработки данных за третий квартал 2023 года.


Примечания и наблюдения
  • Null?: Диски, сообщившие нулевое или пустое значение для своего центра обработки данных, сгруппированы в четыре хранилища Backblaze. Дэвид, старший инженер по инфраструктурному программному обеспечению Drive Stats, описал процесс сбора всех частей данных Drive Stats каждый день. TL:DR заключается в том, что хранилища могут быть слишком заняты, чтобы ответить в тот момент, когда мы запрашиваем, и, поскольку поле центра обработки данных является полезным для хранения данных, мы получаем пустое поле. Мы можем вернуться на день или два назад, чтобы найти значение центра обработки данных, что мы и сделаем в будущем, когда сообщим эти данные.
  • sac0?: sac0 имеет самый высокий AFR среди всех центров обработки данных, но он также имеет самые старые диски — в среднем почти в два раза старше, чем следующий ближайший центр обработки данных, sac2. Как обсуждалось ранее, сбои дисков, похоже, следуют «кривой ванны», хотя в последнее время мы видели, что кривая начинается более пологой. Тем не менее, по мере старения моделей приводов они, как правило, выходят из строя чаще. Другим фактором может быть то, что sac0 и, в меньшей степени, sac2 имеют одни из самых старых модулей хранения данных, в том числе несколько модулей с 45 дисками. Мы находимся в процессе использования CVT для замены этих старых серверов при переходе с дисков емкостью 4 ТБ на диски емкостью 16 ТБ и более.
  • iad1: Центр обработки данных IAD является основой нашего восточного региона и быстро растет с момента его ввода в эксплуатацию около года назад. Этот рост обусловлен сочетанием новых данных и использования клиентами наших возможностей облачной репликации для автоматического копирования своих данных в другом регионе.
  • Данные за третий квартал: эта диаграмма предназначена только для данных за третий квартал и включает все диски с данными, включая те, у которых количество дисков менее 60 на модель. Отслеживая эти данные в ближайшие кварталы, мы надеемся получить некоторое представление о том, действительно ли в разных центрах обработки данных наблюдается разная частота отказов дисков, и если да, то почему.

Частота отказов жесткого диска в течение всего срока службы
По состоянию на 30 сентября 2023 г. мы отслеживали 259 084 жестких диска, используемых для хранения данных клиентов. Для анализа срока службы мы собираем количество дней работы диска и количество сбоев каждого диска, начиная с момента его ввода в эксплуатацию в одном из наших центров обработки данных. Мы группируем эти диски по моделям, а затем суммируем количество дней использования и сбоев для каждой модели за срок их службы. Этот график находится ниже.


Одним из наиболее важных столбцов на этой диаграмме является доверительный интервал, который представляет собой разницу между низким и высоким уровнями достоверности AFR, рассчитанную на уровне 95%. Чем ниже значение, тем больше мы уверены в заявленном AFR. Нам нравится, чтобы доверительный интервал составлял 0,5% или меньше. Когда доверительный интервал выше, это не обязательно плохо, это просто означает, что нам либо нужно больше данных, либо данные несколько противоречивы.

В таблице ниже представлены только те модели приводов, доверительный интервал которых составляет менее 0,5%. Мы отсортировали список по размеру диска, а затем по AFR.


Модели накопителей емкостью 4 ТБ, 6 ТБ, 8 ТБ и некоторые модели накопителей емкостью 12 ТБ больше не производятся. В частности, модели HGST емкостью 12 ТБ все еще можно найти, но они были переименованы в Western Digital и получили альтернативные номера моделей. Изменились ли они существенно внутри, неизвестно, по крайней мере нам.

И последнее замечание относительно данных о сроке службы AFR: вы могли заметить, что AFR для всех накопителей не сильно меняется от квартала к кварталу. Последние два года он колебался между 1,39% и 1,45%. По сути, у нас много приводов с большим сроком службы, поэтому сложно переместить стрелку вверх или вниз. Хотя статистика срока службы отдельных моделей дисков может быть очень полезной, срок службы AFR для всех дисков, вероятно, будет становиться все менее и менее интересным по мере того, как мы добавляем все больше и больше дисков. Конечно, могут поступить несколько сотен тысяч никогда не выходящих из строя накопителей, поэтому мы продолжим рассчитывать и представлять срок службы AFR.

Как мы добились скорости загрузки выше, чем у AWS S3

Вам не всегда нужно самое быстрое облачное хранилище — ваши требования к производительности зависят от вашего варианта использования, бизнес-целей и потребностей в безопасности. Но все же, чем быстрее, тем лучше. А Backblaze только что анонсировала инновацию в облачном хранилище B2, которая обеспечивает гораздо большую скорость: загрузка большинства файлов теперь будет на 30% быстрее, чем в AWS S3.

Сегодня я углублюсь во все детали этого улучшения производительности, расскажу, как мы это сделали и что это значит для вас.

TL:DR
Результаты: согласно нашим тестам, клиенты, которые полагаются на загрузку небольших файлов (1 МБ или меньше), могут ожидать ускорения загрузки в среднем на 10–30 %, и все это без каких-либо изменений в надежности, доступности или цене.

Что это значит для тебя?
Все клиенты B2 Cloud Storage получат выгоду от этих улучшений производительности, особенно те, кто использует Backblaze B2 в качестве места хранения программного обеспечения для защиты данных. Небольшие загрузки размером 1 МБ или меньше составляют около 70% всех загрузок в облачное хранилище B2 и являются обычным явлением для рабочих процессов резервного копирования и архивирования. К конкретным преимуществам повышения производительности относятся:
  • Быстрее защищает данные при удаленном резервном копировании.
  • Освобождает время ИТ-администраторов для работы над другими проектами.
  • Уменьшает перегрузку пропускной способности сети.
  • Более эффективная дедупликация данных.
Veeam стремится работать вместе с нашими партнерами над внедрением инноваций и созданием единого фронта против киберугроз и атак. Новые улучшения производительности, выпущенные Backblaze для облачного хранилища B2, способствуют реализации нашей миссии по обеспечению радикальной устойчивости наших общих клиентов.
Андреас Нойферт, вице-президент по управлению продуктами, альянсы, Veeam

Когда я могу ожидать более быстрой загрузки?
Сегодня. Обновления производительности были полностью развернуты во всех регионах хранения данных Backblaze.

Как мы это сделали
До этой работы, когда клиент загружал файл в Backblaze B2, данные записывались на несколько жестких дисков (HDD). Эти операции необходимо было завершить до возврата ответа клиенту. Теперь мы записываем входящие данные на те же жесткие диски, а также одновременно в пул твердотельных накопителей (SSD), который мы называем «тайником осколков», ожидая только того, пока записи с жесткого диска попадут в память файловых систем. кэши и запись на SSD завершаются перед возвратом ответа. После завершения записи на жесткий диск мы освобождаем место на твердотельных накопителях, чтобы его можно было использовать повторно.

Поскольку запись данных на SSD происходит намного быстрее, чем запись на жесткие диски, конечным результатом является более быстрая загрузка.

Это всего лишь краткое изложение; если вас интересуют технические подробности (а также результаты тщательного тестирования ), читайте дальше!

Путь к повышению производительности
Как вы, возможно, помните из многих сообщений в блогах и вебинарах Drive Stats, Backblaze хранит все данные о клиентах на жестких дисках, которые некоторые ласково называют «вращающейся ржавчиной». Исторически мы резервировали твердотельные накопители для загрузочных дисков Storage Pod (сервера хранения).

До настоящего времени.
Правильно — твердотельные накопители вошли в сферу хранения данных. Чтобы добиться такого повышения производительности, мы объединили производительность твердотельных накопителей с экономической эффективностью жестких дисков. Сначала я немного углублюсь в историю, чтобы добавить некоторый контекст к тому, как мы проводили обновления.

Жесткий диск против SSD
IBM выпустила первый жесткий диск еще в 1957 году, поэтому справедливо сказать, что HDD — это зрелая технология. Емкость накопителей и скорость передачи данных на протяжении десятилетий неуклонно росли, в то время как стоимость одного байта резко упала. Этот первый жесткий диск IBM RAMAC 350 имел общую емкость 3,75 МБ и стоил 34 500 долларов. С поправкой на инфляцию это около 375 000 долларов, что соответствует 100 000 долларов за МБ или 100 миллиардов долларов за ТБ в долларах 2023 года.


Фотография людей, заталкивающих один из первых жестких дисков в грузовик.
Первый жесткий диск, поставляемый IBM.

Сегодня версия Seagate Exos X16 емкостью 16 ТБ — жесткого диска, широко используемого в Backblaze B2 Storage Cloud, — продается по цене около 260 долларов США, 16,25 доллара США за ТБ. Если бы стоимость одного байта у него была такая же, как у IBM RAMAC 250, его можно было бы продать за 1,6 триллиона долларов — примерно столько же, сколько текущий ВВП Австралии!

SSD-накопители, напротив, существуют только с 1991 года, когда 20-мегабайтный диск SanDisk поставлялся в ноутбуки IBM ThinkPad по OEM-цене около 1000 долларов. Давайте рассмотрим современный SSD: Micron 7450 MAX емкостью 3,2 ТБ. Розничная цена Micron SSD составляет около 360 долларов, а цена составляет 112,50 долларов за ТБ, что почти в семь раз дороже, чем у жесткого диска Seagate.

Итак, жесткие диски легко превосходят твердотельные накопители по стоимости хранения, но как насчет производительности? Вот цифры из паспортов производителей:


Поскольку пластины жесткого диска вращаются с постоянной скоростью, в данном случае 7200 об/мин, они могут передавать больше блоков за один оборот на внешнем крае диска, чем ближе к середине — отсюда и две цифры скорости передачи данных X16.

SSD более чем в 20 раз быстрее при устойчивой передаче данных, чем HDD, но посмотрите на разницу в скорости произвольной передачи! Даже когда жесткий диск работает максимально быстро, передавая блоки с внешнего края диска, твердотельный накопитель читает данные более чем в 2200 раз быстрее и записывает почти в 900 раз быстрее.

Такая огромная разница связана с тем, что при чтении данных из случайных мест на диске пластинам приходится совершать в среднем 0,5 оборота между блоками. При скорости 7200 оборотов в минуту (об/мин) это означает, что жесткий диск тратит около 4,2 мс на переход к следующему блоку, прежде чем он сможет даже передать данные. Напротив, в технических характеристиках твердотельного накопителя указана задержка всего 80 мкс (это 0,08 мс) для чтения и 15 мкс (0,015 мс) для записи, что в 84–280 раз быстрее, чем у вращающегося диска.

Давайте рассмотрим реальную операцию, скажем, запись 64 КБ данных. Если предположить, что жесткий диск может записывать эти данные в последовательные секторы диска, он будет вращаться в среднем 4,2 мс, а затем потратит 0,25 мс на запись данных на диск, в общей сложности 4,5 мс. SSD, напротив, может мгновенно записывать данные в любое место, затрачивая на это всего 27 мкс (0,027 мс). Это (отчасти теоретическое) преимущество в скорости в 167 раз является основой улучшения производительности.

Почему я выбрал блок размером 64 КБ? Как мы упоминали в недавнем сообщении в блоге, посвященном производительности облачного хранилища, в целом файлы большего размера лучше, когда речь идет о совокупном времени, необходимом для загрузки набора данных. Однако могут существовать и другие требования, требующие использования файлов меньшего размера. Многие приложения резервного копирования разбивают данные на блоки фиксированного размера для загрузки в виде файлов в облачное объектное хранилище. При выборе размера блока существует компромисс: блоки большего размера улучшают скорость резервного копирования, а блоки меньшего размера уменьшают требуемый объем хранилища. На практике блоки резервных копий могут иметь размер всего 1 МБ или даже 256 КБ. Блоки по 64 КБ, которые мы использовали в приведенных выше расчетах, представляют собой фрагменты, составляющие файл размером 1 МБ.

Задача, стоящая перед нашими инженерами, заключалась в том, чтобы воспользоваться преимуществами скорости твердотельных накопителей для ускорения загрузки небольших файлов без больших затрат.

Улучшение производительности записи небольших файлов
Когда клиентское приложение загружает файл в Backblaze B2 Storage Cloud, модуль координатора разбивает файл на 16 сегментов данных, создает четыре дополнительных сегмента четности и записывает полученные 20 сегментов на 20 разных жестких дисков, каждый в отдельный модуль.

Примечание. По мере увеличения емкости жесткого диска увеличивается и время, необходимое для восстановления после сбоя диска, поэтому мы периодически корректируем соотношение между сегментами данных и фрагментами четности, чтобы поддерживать целевой уровень надежности в одиннадцать девяток. Раньше вы слышали, как мы говорили о соотношении 17 + 3, но мы также используем 16 + 4, а в наших новейших хранилищах используется схема 15 + 5.

Каждый под записывает входящий осколок в свою локальную файловую систему; на практике это означает, что данные записываются в кэш в памяти и будут записаны на физический диск в какой-то момент в ближайшем будущем. Любые запросы к файлу могут быть удовлетворены из кэша, но данные еще не сохранены постоянно.

Мы должны быть абсолютно уверены, что сегменты были записаны на диск, прежде чем мы вернем ответ «успех» клиенту, поэтому каждый под выполняет системный вызов fsync для передачи («сброса») данных сегментов из системной памяти через жесткий диск. записать кеш на сам диск перед возвратом его статуса координатору. Когда координатор получил как минимум 19 успешных ответов, он возвращает ответ об успехе клиенту. Это гарантирует, что даже если весь центр обработки данных отключится от электропитания сразу после загрузки, данные будут сохранены.

Как мы объяснили выше, для небольших блоков данных подавляющая часть времени, затрачиваемого на запись данных на диск, тратится на ожидание поворота диска в правильное место. Запись сегментов на SSD может привести к значительному увеличению производительности для небольших файлов, но как насчет семикратной разницы в стоимости?

Наши инженеры придумали, как получить кусок пирога и съесть его, используя скорость твердотельных накопителей без значительного увеличения стоимости. Теперь, получив файл размером 1 МБ или меньше, координатор, как и раньше, разбивает его на шарды, а затем одновременно отправляет шарды набору из 20 подов и отдельному пулу серверов, каждый из которых заполнен 10 описанными выше твердотельными накопителями Micron — «тайник осколков». Серверы Shard Stash легко выигрывают гонку «сбросить данные на диск» и возвращают свой статус координатору всего за несколько миллисекунд. Тем временем каждый модуль жесткого диска записывает свой сегмент в файловую систему, ставит в очередь задачу по сбросу данных сегмента на диск и возвращает подтверждение координатору.

Как только координатор получает ответы, подтверждающие, что по крайней мере 19 из 20 подов записали свои шарды в файловую систему и по крайней мере 19 из 20 шардов были сброшены на SSD, он возвращает свой ответ клиенту. Опять же, если в этот момент произойдет сбой питания, данные уже будут безопасно записаны в твердотельное хранилище.

Мы не хотим оставлять данные на твердотельных накопителях дольше, чем необходимо, поэтому каждый под, закончив запись своего шарда на диск, сигнализирует тайнику шарда, что он может очистить свою копию шарда.

Реальный прирост производительности
Как я уже упоминал выше, рассчитанное 167-кратное преимущество SSD в производительности над HDD является в некоторой степени теоретическим. В реальном мире время, необходимое для загрузки файла, также зависит от ряда других факторов: близости к центру обработки данных, скорости сети, а также всего программного и аппаратного обеспечения между клиентским приложением и устройством хранения данных, и это лишь некоторые из них.

Первым регионом Backblaze, получившим повышение производительности, стал Восток США, расположенный в Рестоне, штат Вирджиния. За 12-дневный период после развертывания тайника осколков среднее время загрузки файла размером 256 КБ составило 118 мс, а файла размером 1 МБ — 137 мс. Чтобы воспроизвести типичную клиентскую среду, мы запустили тестовое приложение в дата-центре нашего партнера Vultr в Нью-Джерси, загрузив данные в Backblaze B2 через общедоступный Интернет.

Для сравнения мы провели тот же тест на восточном регионе США (Северная Вирджиния) Amazon S3, us-east-1на той же машине в Нью-Джерси. В среднем загрузка файла размером 256 КБ на S3 занимала 157 мс, а файла размером 1 МБ — 153 мс.

Итак, сравнивая Backblaze B2 в восточном регионе США с эквивалентом Amazon S3, мы оценили новый улучшенный Backblaze B2 как на 30 % быстрее, чем S3 для файлов размером 256 КБ, и на 10% быстрее, чем S3 для файлов размером 1 МБ.

Эти низкоуровневые тесты были подтверждены, когда мы засекли время, когда программное обеспечение Veeam Backup & Replication выполняло резервное копирование 1 ТБ виртуальных машин с размером блока 256 КБ. Резервное копирование сервера на Amazon S3 заняло три часа 12 минут; мы измерили время того же резервного копирования на Backblaze B2 всего за два часа 15 минут, что на 40 % быстрее, чем у S3.

Методика тестирования
Мы написали простое тестовое приложение Python с использованием AWS SDK для Python (Boto3). Каждый тестовый запуск включал синхронизацию 100 загрузок файлов с использованием API S3 PutObject с задержкой 10 мс между каждой загрузкой. (К вашему сведению, задержка не включена в измеренное время.) Тестовое приложение использовало одно соединение HTTPS во время тестового запуска, следуя рекомендациям по использованию API. В течение последних нескольких недель мы проводили тестирование на виртуальной машине в регионе Vultr в Нью-Джерси каждые шесть часов в течение последних нескольких недель как для нашего восточного региона США, так и для его соседа по AWS. Задержка до конечной точки API Backblaze B2 составила в среднем 5,7 мс, до конечной точки API Amazon S3 — 7,8 мс, измеренная по 100 пинг-запросам.

Что дальше?
На момент написания серверы Shard Stash были развернуты во всех наших центрах обработки данных во всех наших регионах. На самом деле, вы, возможно, даже заметили, что небольшие файлы загружаются быстрее. Важно отметить, что эта конкретная оптимизация — лишь одно из серии улучшений производительности, которые мы реализовали, и их будет еще больше. Можно с уверенностью сказать, что все наши клиенты Backblaze B2 будут наслаждаться более быстрой загрузкой и выгрузкой, независимо от нагрузки на их хранилище.

Обновления продуктов и цен Backblaze



В ближайшие месяцы Backblaze выпустит большие обновления и обновления для обоих наших продуктов — B2 Cloud Storage и Computer Backup. Учитывая количество новых вещей, которые ожидаются на горизонте, сегодня я захожу в блог, чтобы объяснить, что происходит, когда и почему для наших клиентов, а также для всех, кто рассматривает возможность использования наших услуг. Вот что нового.

Обновления облачного хранилища B2
Цена, выход и обновления продукта

Удовлетворение и превышение потребностей клиентов в создании приложений, защите данных, поддержке рабочих процессов мультимедиа и т.д. является главным приоритетом для B2 Cloud Storage. Для дальнейшего развития этих усилий мы будем внедрять следующие обновления:

Изменения цен
Цена хранилища: с 3 октября 2023 г. мы увеличиваем ежемесячную стоимость хранилища с оплатой по мере использования с 5 долларов США за ТБ до 6 долларов США за ТБ. Цена B2 Reserve не изменится.

Бесплатный выход: также с 3 октября мы делаем выход бесплатным (т.е. бесплатную загрузку данных) для всех клиентов облачного хранилища B2 — как с оплатой по факту, так и с резервированием B2 — до трехкратного объема данных, которые вы храните. у нас, при этом любой дополнительный выход стоит всего 0,01 доллара США за ГБ. Поскольку поддержка открытой облачной среды занимает центральное место в нашей миссии, ключевым следующим шагом является предоставление всем клиентам бесплатного доступа, чтобы они могли перемещать данные, когда и куда они предпочитают.

Обновления Backblaze B2
От блокировки объектов для защиты от программ-вымогателей до облачной репликации для резервирования и большего количества центров обработки данных для поддержки потребностей в местоположении данных — Backblaze постоянно совершенствует облачное хранилище B2. Следите за новостями этой осенью, когда мы объявим об улучшении производительности загрузки, расширенной интеграции и новых партнерских отношениях.

Вещи, которые не меняются
Цены на хранилище по гарантированным контрактам, цены B2 Reserve и неограниченный бесплатный исходящий трафик между Backblaze B2 и многими ведущими сетями доставки контента (CDN) и вычислительными партнерами — все это остается неизменным.

Почему произошли изменения в облачном хранилище B2?
1. Продолжаем предоставлять лучшее облачное хранилище.

Я рад, что облачное хранилище B2 продолжает оставаться лучшей высококачественной и недорогой альтернативой традиционным поставщикам облачных услуг, таким как AWS, для предприятий любого размера. После семи лет эксплуатации без повышения цен планка стала очень высокой для рассмотрения любых изменений в наших ценах. Мы каждый день инвестируем в то, чтобы сделать Backblaze B2 лучшим поставщиком облачных хранилищ. Повышение цен позволит нам продолжать делать это и в будущем.

2. Обеспечение свободы данных клиентов.
Мы слышали от клиентов, что одним из самых больших преимуществ облачного хранилища B2 является свобода — свобода от сложностей, неконтролируемых счетов и блокировки данных. Мы хотели удвоить эти преимущества и предоставить нашим клиентам возможность использовать открытое облако для использования своих данных так и где они пожелают. Обеспечение бесплатного исходящего трафика обеспечивает все эти преимущества для наших клиентов.

Резервное копирование компьютера Backblaze
Цена, история версий, версия 9.0 и обновления для администратора
Чтобы расширить наши возможности по обеспечению удивительно простого резервного копирования компьютеров, которое было бы одновременно надежным, надежным и доступным, мы вводим следующие обновления для Backblaze Computer Backup и делимся некоторыми предстоящими обновлениями продукта:
  • Цены на резервное копирование компьютера: с 3 октября новые покупки и продления будут составлять 9 долларов США в месяц, 99 долларов США в год и 189 долларов США за двухлетние планы подписки, а цена Forever Version History составит 0,006 долларов США за ГБ в месяц.
  • Бесплатная расширенная история версий на один год. Также с 3 октября ко всем лицензиям на резервное копирование компьютеров можно будет бесплатно добавить расширенную историю версий на один год, ранее стоимость которой составляла 2 доллара США в месяц. Возможность восстановить удаленные или измененные файлы в течение года спустя избавляет пользователей Computer Backup от огромных головных болей, и теперь это преимущество доступно всем подписчикам. Начиная с 3 октября войдите в свою учетную запись и бесплатно выберите «Один год расширенной истории версий».
  • Версия 9.0: В сентябре выйдет версия 9.0. Помимо некоторых улучшений производительности и удобства использования, этот выпуск включает в себя очень востребованную новую функцию локального восстановления для конечных пользователей. Мы поделимся с вами всеми подробностями в сентябре, когда выйдет версия 9.0.
  • Обновления администрирования групп. В дополнение к версии 9.0 у нас есть впечатляющий план обновлений функциональности наших групп, направленный на обслуживание нашей растущей и развивающейся клиентской базы. Тем, кому необходимо управлять всем, от двух до двух тысяч рабочих станций, мы рады предложить больше спокойствия и контроля с помощью расширенных инструментов, созданных для предприятий, по цене, которая все еще опережает конкурентов.
  • Почему произошли изменения в резервном копировании компьютера?

С момента запуска Computer Backup в 2008 году мы остаемся приверженцами продукта, который автоматически создает резервные копии всех ваших данных в облаке по фиксированной ставке. За следующие 15 лет средний объем данных, хранящихся на одного пользователя, значительно вырос, и наши инвестиции в создание нашего облака хранения для поддержки этого роста увеличились, чтобы не отставать от этого темпа.

В то же время мы продолжаем инвестировать в улучшение продукта — как мы это делали недавно с предстоящим выпуском версии 9.0, в нашу активную разработку новых функций администрирования групп и в бесплатное добавление дополнительной расширенной версии на один год. история для всех пользователей. И нам еще многое предстоит сделать, чтобы наш продукт всегда соответствовал своим обещаниям.

Чтобы продолжать предлагать неограниченное резервное копирование, внедрять инновации и повышать ценность лучших услуг резервного копирования компьютеров, нам необходимо привести наши цены в соответствие с нашими затратами.

Спасибо
Мы понимаем, насколько ценны ваши данные для вашего бизнеса и вашей жизни, и доверие, которое вы оказываете Backlaze каждый день, не потеряно для меня. Мы глубоко привержены нашей миссии — сделать хранение, использование и защиту этих данных удивительно простыми, и обновления, которыми я поделился сегодня, — это большой шаг вперед в обеспечении того, чтобы мы могли делать это в долгосрочной перспективе. Итак, в заключение я скажу спасибо за то, что доверили нам свои ценные данные — для нас большая честь служить вам.

Статистика Backblaze Drive за второй квартал 2023 года



В конце второго квартала 2023 года Backblaze отслеживала 245 757 жестких дисков и твердотельных накопителей в наших центрах обработки данных по всему миру. Из этого числа 4460 являются загрузочными дисками, 3144 — твердотельными накопителями и 1316 — жесткими дисками. Частота отказов твердотельных накопителей анализируется в обзоре SSD Edition: 2022 Drive Stats.

Сегодня мы сосредоточимся на 241 297 накопителях данных, находящихся под управлением, и проанализируем их ежеквартальную и пожизненную частоту отказов по состоянию на конец второго квартала 2023 года. некоторые дополнительные поля данных, которые мы теперь включаем, и многое другое.

Частота отказов жестких дисков за второй квартал 2023 г.
В конце второго квартала 2023 года мы управляли 241 297 жесткими дисками, используемыми для хранения данных. Для нашего обзора мы исключили из рассмотрения 357 накопителей, поскольку они использовались для целей тестирования или моделей накопителей, в которых не было по крайней мере 60 дисков. Это оставляет нам 240 940 жестких дисков, сгруппированных в 31 модель. В таблице ниже приведена годовая частота отказов (AFR) для этих моделей накопителей за второй квартал 2023 года.


Примечания и наблюдения по статистике привода за второй квартал 2023 г.
Отсутствие отказов. Во втором квартале 2023 г. было шесть моделей накопителей без отказов, как показано в таблице ниже.


Таблица отсортирована по количеству дней вождения каждой модели за квартал. Как правило, модель вождения должна иметь не менее 50 000 дней вождения в квартале, чтобы быть статистически значимой. Все три ведущих диска соответствуют этому критерию, и отсутствие сбоев за квартал неудивительно, учитывая, что AFR за весь срок службы для трех дисков колеблется от 0,13% до 0,45%. Ни один из трех нижних дисков не накопил 50 000 дней работы в квартале, но два диска Seagate показали хороший старт. И всегда приятно видеть, что Toshiba емкостью 4 ТБ (модель: MD04ABA400V) с восемью годами службы не имеет ни одного сбоя за квартал.

Самый старый диск? Моделью диска с самым старым средним возрастом по-прежнему является Seagate емкостью 6 ТБ (модель: ST6000DX000) с возрастом 98,3 месяца (8,2 года), а возраст самого старого диска в этой когорте составляет 104 месяца (8,7 года).

Самым старым рабочим накопителем данных в парке является Seagate емкостью 4 ТБ (модель: ST4000DM000) с возрастом 105,2 месяца (8,8 года). Это впечатляет, особенно в среде центра обработки данных, но победителем в номинации «Самый старый действующий диск в нашем парке» на самом деле является загрузочный диск: диск WDC емкостью 500 ГБ (модель: WD5000BPKT) со сроком службы 122 месяца (10,2 года).

Повышение AFR: AFR во втором квартале 2023 г. составил 2,28% по сравнению с 1,54% в первом квартале 2023 г. Хотя квартальные показатели AFR могут быть неустойчивыми, они также могут быть полезны для выявления тенденций, требующих дальнейшего изучения. В данном случае рост был ожидаем, так как возраст нашего флота продолжает увеличиваться. Но было ли это настоящей причиной?

Углубившись, мы начнем с годовой частоты отказов и среднего возраста наших дисков, сгруппированных по размеру диска, как показано в таблице ниже.


Для нашей цели мы определим диск как старый, если ему исполнилось пять или более лет. Почему? Это гарантийный срок дисков, которые мы покупаем сегодня. Конечно, на диски емкостью 4 ТБ и 6 ТБ, а также на некоторые из дисков емкостью 8 ТБ распространяется только двухлетняя гарантия, но для согласованности мы будем придерживаться пяти лет в качестве точки, по достижении которой диск помечается как «старый».

Использование нашего определения для старых дисков исключает диски емкостью 12 ТБ, 14 ТБ и 16 ТБ. Это оставляет нам приведенную ниже диаграмму ежеквартального AFR за последние три года для каждой группы старых дисков, моделей емкостью 4 ТБ, 6 ТБ, 8 ТБ и 10 ТБ.


Интересно, что самые старые диски емкостью 4 ТБ и 6 ТБ выдерживают свои испытания. Да, за последний год или около того произошло увеличение, но, учитывая их возраст, у них все хорошо.

С другой стороны, диски емкостью 8 ТБ и 10 ТБ со средним сроком службы пять и шесть лет соответственно требуют дополнительного внимания. Далее в этом отчете мы рассмотрим данные о продолжительности жизни, чтобы убедиться, что наши выводы оправданы.

Что нового в данных Drive Stats?
В течение последних 10 лет мы собираем и храним данные статистики дисков, а с 2015 года мы открыли исходный код файлов данных, которые мы использовали для создания отчетов статистики дисков. Время от времени в схему добавляются новые пары атрибутов SMART, поскольку мы устанавливаем новые модели дисков, которые сообщают о новых наборах атрибутов SMART. В этом квартале мы решили собрать и сохранить некоторые дополнительные поля данных о дисках и среде, в которой они работают, и добавили их в общедоступные файлы статистики дисков, которые мы публикуем каждый квартал.

Новые поля данных
Начиная с данных Drive Stats за Q2 2023, в каждой записи диска появляются три новых поля данных.
  • Vault_id: все диски с данными являются членами хранилища Backblaze. Каждое хранилище состоит из 900 или 1200 жестких дисков, равномерно распределенных по 20 серверам хранения. Хранилище представляет собой числовое значение, начинающееся с 1000.
  • Pod_id: в каждом хранилище Backblaze есть 20 серверов хранения. Pod_id — это числовое поле со значениями от 0 до 19, назначенное одному из 20 серверов хранения.
  • Is_legacy_format: в настоящее время 0, но будет полезен в ближайшие кварталы по мере добавления дополнительных полей.
Новая схема выглядит следующим образом:
  • date
  • serial_number
  • model
  • capacity_bytes
  • failure
  • vault_id
  • pod_id
  • is_legacy_format
  • smart_1_normalized
  • smart_1_raw
  • Remaining SMART value pairs (as reported by each drive model)
Оставшиеся пары значений SMART (согласно каждой модели диска)
Время от времени наши читатели спрашивали, есть ли у нас дополнительная информация о том, где живет диск и, что более важно, где он умер. Недавно добавленные поля данных выше являются частью внутренних данных о диске, которые мы собираем каждый день, но они не были включены в данные статистики диска, которые мы используем для создания отчетов статистики диска. С помощью Дэвида из нашей команды Infrastructure Software эти поля теперь будут доступны в данных Drive Stats.

Как мы можем использовать информацию о Vault и Pod?
Сначала предостережение: у нас есть ровно четверть этих новых данных. Хотя было заманчиво создавать диаграммы и таблицы, мы хотим увидеть данные за пару кварталов, чтобы лучше понять их. Ищите первоначальный анализ позже в этом году.

Тем не менее, эти данные дают нам сервер хранения и хранилище каждого диска. Работая в обратном направлении, мы должны иметь возможность задавать такие вопросы, как: «Являются ли определенные серверы хранения более склонными к отказу дисков?» или «Какие модели дисков лучше или хуже работают с определенными серверами хранения?» Кроме того, мы надеемся добавить такие элементы данных, как тип сервера хранения и центр обработки данных, чтобы предоставить дополнительную информацию о нашей платформе облачного хранилища с несколькими эксабайтами.

На протяжении многих лет мы использовали данные Drive Stats внутри компании, чтобы повысить эффективность работы и надежность. Предоставление этих новых элементов данных всем через наши отчеты Drive Stats и загрузку данных — это правильное решение.

В городе появился новый драйв
Если вы все же решите скачать наши данные Drive Stats за второй квартал 2023 года, вас ждет сюрприз — новая модель накопителя. Таких дисков всего четыре, поэтому их легко не заметить, и они не указаны ни в одной из таблиц и диаграмм, которые мы публикуем, поскольку на данный момент они считаются «тестовыми» дисками. Но если вы просматриваете данные, выполните поиск модели «WDC WUH722222ALE6L4», и вы найдете наши недавно установленные диски WDC емкостью 22 ТБ. Они прошли тестирование в конце второго квартала и проходят испытания, пока мы говорим. Следите за обновлениями. (Псс, по состоянию на 28.07 ни один не вышел из строя.)

Частота отказов жестких дисков за весь срок службы
По состоянию на 30 июня 2023 г. мы отслеживали 241 297 жестких дисков, используемых для хранения данных клиентов. Для нашего анализа жизненного цикла мы удалили 357 дисков, которые использовались только в целях тестирования или не имели по крайней мере 60 дисков, представленных в полном наборе данных. Таким образом, у нас остается 240 940 жестких дисков, сгруппированных по 31 модели, для анализа приведенной ниже таблицы срока службы.


Примечания и наблюдения о статистике жизни
Пожизненный AFR также повышается. Годовая частота отказов за весь срок службы для всех перечисленных выше дисков составляет 1,45 %. Это на 0,05% больше, чем в предыдущем квартале на 1,40%. Ранее в этом отчете, изучив данные за второй квартал 2023 года, мы определили диски емкостью 8 ТБ и 10 ТБ в качестве основных подозреваемых в увеличении скорости. Давайте посмотрим, сможем ли мы подтвердить это, изучив изменение показателей AFR за весь срок службы различных дисков, сгруппированных по размеру.


Красная линия — это наш базовый уровень, так как это разница между Q1 и Q2 (0,05%) AFR за весь срок службы для всех дисков. Диски выше красной линии поддерживают увеличение, диски ниже линии вычитают из увеличения. Основными дисками (по размеру), которые «движут» увеличенную годовую частоту отказов в течение всего срока службы, являются диски емкостью 8 ТБ и 10 ТБ. Это подтверждает то, что мы обнаружили ранее. Учитывая, что накопителей на 10 ТБ относительно немного (1124) по сравнению с дисками на 8 ТБ (24 891), давайте углубимся в модели дисков на 8 ТБ.

Пожизненная AFR для всех дисков емкостью 8 ТБ подскочила с 1,42% в первом квартале до 1,59% во втором квартале. Увеличение на 12%. В эксплуатации находится шесть моделей накопителей емкостью 8 ТБ, но на три из этих моделей приходится 99,5 % отказов дисков для когорты накопителей емкостью 8 ТБ, поэтому мы сосредоточимся на них. Они перечислены ниже.


Для всех трех моделей увеличение годовой частоты отказов за весь срок службы с Q1 по Q2 составляет 10 % или более, что статистически аналогично увеличению на 12 % для всех моделей накопителей емкостью 8 ТБ. Если бы вам нужно было выбрать одну модель накопителя, на которую нужно было бы сосредоточиться при миграции, любой из трех был бы хорошим кандидатом. Но диски Seagate модели ST8000DM002 в среднем почти на год старше других рассматриваемых моделей дисков.

Не совсем всю жизнь? В приведенной выше таблице анализируются данные за период с 20 апреля 2013 г. по 30 июня 2023 г., или 10 лет, 2 месяца и 10 дней. Как отмечалось ранее, самому старому диску, который у нас есть, 10 лет и 2 месяца, плюс-минус день или два. Казалось бы, нам нужно изменить заголовок нашей таблицы, но пока не совсем. Диск, который был установлен в любое время во втором квартале 2013 года и все еще работает сегодня, будет сообщать о днях работы диска как часть данных о сроке службы для этой модели. Как только все диски, установленные во втором квартале 2013 года, исчезнут, мы сможем соответствующим образом изменить дату начала в наших таблицах и диаграммах.

Несколько слов об отказе привода
Беспокоит ли нас увеличение количества отказов накопителей? Конечно, нам бы хотелось, чтобы они были ниже, но неизбежная реальность бизнеса облачных хранилищ заключается в том, что диски выходят из строя. За прошедшие годы мы наблюдали широкий диапазон частот отказов у разных производителей, моделей и размеров дисков. Если вы не готовы к этому, вы потерпите неудачу. В рамках нашей подготовки мы используем данные статистики дисков как один из многих входных данных для понимания нашей среды, чтобы мы могли корректировать, когда и как нам нужно.

Итак, нас беспокоит увеличение количества отказов накопителей? Нет, но мы и не высокомерны. Мы продолжим следить за нашими системами, при необходимости примем меры и по ходу дела поделимся с вами тем, что сможем.

Данные статистики жесткого диска
Полный набор данных, использованных для создания информации, используемой в этом обзоре, доступен на нашей веб-странице «Статистика жесткого диска». Вы можете скачать и использовать эти данные бесплатно в своих целях. Все, что мы просим, это три вещи: 1) вы указываете Backblaze в качестве источника, если вы используете данные, 2) вы соглашаетесь с тем, что вы несете единоличную ответственность за то, как вы используете данные, и 3) вы никому не продаете эти данные; это бесплатно.

Если вы хотите, чтобы таблицы и диаграммы использовались в этом отчете, вы можете загрузить ZIP-файл из облачного хранилища Backblaze B2, который содержит электронную таблицу MS Excel с вкладками для каждой из таблиц или диаграмм.

Удачи и дайте нам знать, если вы найдете что-нибудь интересное.

Статистика Backblaze Drive за первый квартал 2023 года

Давным-давно в далекой-далекой галактике мы начали собирать и хранить данные Drive Stats. Точнее это было 10 лет назад, а галактика была как раз Северной Калифорнией, хотя с тех пор она расширилась (как известно галактики делают). За последние 10 лет многое произошло с тем, где, когда и как мы получаем данные статистики вождения, но, тем не менее, данные статистики вождения за первый квартал 2023 года готовы, так что давайте начнем.

По состоянию на конец первого квартала 2023 года Backblaze отслеживала 241 678 жестких дисков (HDD) и твердотельных накопителей (SSD) в наших центрах обработки данных по всему миру. Из этого числа 4400 являются загрузочными дисками, из них 3038 твердотельных накопителей и 1362 жестких диска. Частота отказов твердотельных накопителей анализируется в обзоре SSD Edition: 2022 Drive Stats.

Сегодня мы сосредоточимся на 237 278 дисках с данными, находящихся под управлением, и проанализируем их ежеквартальную и пожизненную частоту отказов по состоянию на конец первого квартала 2023 года. более. Попутно мы будем делиться своими наблюдениями и выводами о представленных данных и, как всегда, надеемся, что вы сделаете то же самое в разделе комментариев в конце поста.

Частота отказов жестких дисков за первый квартал 2023г.
Начнем с обзора наших данных за первый квартал 2023 года. В этом квартале мы отследили 237 278 жестких дисков, используемых для хранения данных клиентов. Для нашей оценки мы исключили из рассмотрения 385 дисков, поскольку они использовались для целей тестирования или представляли собой модели дисков, в которых не было по крайней мере 60 дисков. Это оставляет нам 236 893 жестких диска, сгруппированных по 30 различным моделям для анализа.


Примечания и наблюдения по статистике привода за первый квартал 2023 г.
Повышение AFR: Годовая частота отказов (AFR) за 1 квартал 2023 г. составила 1,54%, что выше, чем в 4 квартале 2022 г. на 1,21%, и по сравнению с 1 кварталом 2022 г. год назад на 1,22%. Квартальные показатели AFR могут быть неустойчивыми, но они могут быть полезны для определения тенденции, требующей дальнейшего изучения. Например, три диска в первом квартале 2023 года (перечисленные ниже) более чем удвоили свой индивидуальный AFR с четвертого квартала 2022 года по первый квартал 2023 года. Как следствие, требуется дополнительная проверка (или, в некоторых случаях, продолжение проверки) этих дисков.

Нули и единицы: в приведенной ниже таблице показаны модели дисков, у которых в первом квартале 2023 г. не было ни одного, ни одного отказа.


При просмотре таблицы любая модель привода с менее чем 50 000 дней вождения за квартал не имеет достаточного количества данных для статистической значимости за этот период. Тем не менее, для двух из перечисленных моделей приводов сообщение об отсутствии сбоев не является чем-то новым. У Seagate на 16 ТБ (модель: ST16000NM002J) также не было сбоев в прошлом квартале, а у Seagate на 8 ТБ (модель: ST8000NM000A) не было сбоев с момента его первой установки в третьем квартале 2022 года, при этом AFR за весь срок службы составляет 0 %.

Новая, но не такая уж новая модель накопителя: в первом квартале 2023 года появится одна новая модель накопителя — Toshiba емкостью 8 ТБ (модель: HDWF180). На самом деле, это не ново, просто в этом квартале у нас сейчас в производстве 60 дисков, так что это попало в чарты. Эта модель фактически находится в производстве с первого квартала 2022 года, начиная с 18 дисков и со временем добавляя больше дисков. Почему? Эта модель диска заменит некоторые из 187 отказавших дисков емкостью 8 ТБ в этом квартале. У нас есть запасы дисков разных размеров, которые мы держим под рукой именно по этой причине.
Количество отказов в годовом исчислении за 1 квартал 2023 г. по размеру накопителя и производителю
На приведенных ниже диаграммах приведены данные за первый квартал 2023 года сначала по размеру диска, а затем по производителю.


Хотя мы включили все размеры дисков, которые мы используем в настоящее время, размеры дисков 6 ТБ и 10 ТБ состоят из одной модели для каждой, и у каждого есть ограниченное количество дней работы в квартале: 79 651 для дисков 6 ТБ и 105 443 для дисков 10 ТБ. Каждый из оставшихся размеров дисков имеет не менее 2,2 миллиона дней работы, что делает их квартальные годовые коэффициенты отказов более надежными.


В этой таблице объединены все модели приводов производителя независимо от их возраста. В нашем случае многие из старых моделей накопителей произведены Seagate, и это помогает повысить их общую AFR. Например, 60 % дисков емкостью 4 ТБ произведены Seagate, и их средний возраст составляет 89 месяцев, а более 95 % находящихся в производстве дисков емкостью 8 ТБ произведены Seagate, и им в среднем более 70 месяцев. Как мы видели, изучая ожидаемый срок службы жесткого диска с помощью кривой ванны, старые диски имеют тенденцию к более частым отказам.

Тем не менее, есть исключения, такие как наш бесстрашный парк дисков Seagate емкостью 6 ТБ, средний возраст которых составляет 95,4 месяца, а показатель AFR за первый квартал 2023 года составляет 0,92 %, а показатель AFR за весь срок службы — 0,89 %, как мы увидим далее в этом отчете.

Средний возраст отказа диска
Недавно ребята из Blocks & Files опубликовали статью, в которой описывается средний возраст жесткого диска на момент выхода из строя. Статья основана на работе Тимоти Берли в Secure Data Recovery. Подводя итог, статья показала, что для 2007 проанализированных отказавших жестких дисков средний возраст выхода из строя составил 1051 день, или два года и 10 месяцев. Мы подумали, что это интересный способ взглянуть на отказ диска, и мы хотели знать, что мы обнаружим, если зададим тот же вопрос о наших данных Drive Stats. Они также определили текущее количество ожидающих секторов для каждого отказавшего диска, но сегодня мы сосредоточимся на среднем возрасте отказа диска.

Начиная
В статье не указано, как они собирали количество времени, в течение которого диск работал до того, как он вышел из строя, но мы предполагаем, что они использовали необработанное значение SMART 9 для часов включения. Учитывая это, нашей первой задачей было собрать все неисправные диски в нашем наборе данных и записать время работы каждого диска. Этот запрос выдал список из 18 605 дисков, которые вышли из строя в период с 10 апреля 2013 г. по 30 марта 2023 г. включительно.

Для каждого вышедшего из строя диска мы записали дату, серийный_номер, модель, емкость_диска, сбой и необработанное значение SMART 9. Образец ниже.


Чтобы начать процесс очистки данных, мы сначала удалили из набора данных 1355 неисправных загрузочных дисков, оставив нам 17 250 дисков с данными.

Затем мы удалили 95 дисков по одной из следующих причин:
  • На отказавшем диске не было записанных данных или был ноль в атрибуте SMART 9 raw.
  • Неисправный диск имел данные за пределами допустимых значений в одном или нескольких полях.
Например, поле capacity_bytes было отрицательным или модель повреждена, то есть неизвестна или непонятна.
В обоих этих случаях рассматриваемые диски находились в неудовлетворительном состоянии на момент сбора данных, и поэтому любые другие собранные данные могли быть ненадежными.

У нас осталось 17 155 неисправных дисков для анализа. Когда мы вычисляем средний возраст, в котором эта когорта дисков вышла из строя, мы получаем 22 360 часов, что составляет 932 дня, или чуть более двух лет и шести месяцев. Это довольно близко к двум годам и 10 месяцам из статьи Blocks & Files, но прежде чем мы подтвердим их цифры, давайте немного углубимся в наши результаты.

Средний возраст отказов дисков по моделям и размерам
Наш набор данных Drive Stats содержит сведения о сбоях дисков для 72 моделей дисков, и это число не включает загрузочные диски. Чтобы сделать нашу таблицу более управляемой, мы ограничили список теми моделями накопителей, в которых зафиксировано 50 и более отказов. Полученный список содержит 30 моделей, которые мы отсортировали по среднему возрасту отказов:


Как и следовало ожидать, существуют модели накопителей старше и младше нашего общего среднего возраста отказов, составляющего два года и шесть месяцев. Одно наблюдение состоит в том, что средний срок отказа многих моделей накопителей меньшего размера (1 ТБ, 1,5 ТБ, 2 ТБ и т. д.) выше, чем наш общий средний показатель, составляющий два года и шесть месяцев. И наоборот, для многих моделей дисков большего размера (12 ТБ, 14 ТБ и т. д.) средний срок службы после отказа был ниже среднего. Прежде чем делать какие-либо выводы, давайте посмотрим, что произойдет, если мы рассмотрим средний возраст отказа по размеру диска, как показано ниже.


Эта диаграмма, по-видимому, подтверждает общую тенденцию, заключающуюся в том, что средний срок службы до отказа небольших моделей дисков выше, чем у более крупных моделей.

На этом этапе вы можете начать размышлять о том, повлияют ли технологии в более крупных накопителях, такие как дополнительные пластины, повышенная плотность записи или даже использование гелия, на средний срок службы этих накопителей. Но как сказал бы невозмутимый адмирал Акбар:

«Это ловушка»
Ловушка заключается в том, что набор данных для моделей дисков меньшего размера в нашем случае является полным — в нашем наборе данных больше нет дисков емкостью 1 ТБ, 1,5 ТБ, 2 ТБ, 3 ТБ или даже 5 ТБ. Наоборот, большинство моделей дисков большего размера все еще находятся в эксплуатации и, следовательно, они «еще не перестали выходить из строя». Другими словами, поскольку эти более крупные диски будут продолжать выходить из строя в ближайшие месяцы и годы, они могут увеличить или уменьшить средний срок отказа этой модели диска.

Новая надежда
Один из способов продвинуться вперед на этом этапе — ограничить наши вычисления только теми моделями дисков, которые больше не используются в наших центрах обработки данных. Сделав это, мы обнаружим, что у нас есть 35 моделей дисков, состоящих из 3379 дисков, средний срок эксплуатации которых составляет два года и семь месяцев.

Ловушка или нет, но наши результаты согласуются со статьей Blocks & Files, поскольку их средний возраст неудачного набора данных составляет два года и 10 месяцев. Будет интересно посмотреть, как это сравнение сохранится с течением времени, поскольку все больше моделей накопителей в нашем наборе данных заканчивают свой срок службы Backblaze.

Второй способ взглянуть на неисправность диска — рассмотреть проблему с точки зрения ожидаемого срока службы. Этот подход берет пример из биологии и использует методы Каплана-Мейера для получения кривых ожидаемой продолжительности жизни (также известных как выживание) для различных когорт, в нашем случае для моделей жестких дисков. Мы использовали такие кривые ранее в наших сообщениях в блогах Hard Drive Life Expectancy и Bathtub Curve. Такой подход позволяет нам отслеживать частоту отказов с течением времени и помогает ответить на такие вопросы, как «Если я куплю диск сегодня, каковы шансы, что он прослужит x лет?»

Давайте подведем итоги
У нас есть три разных, но похожих значения среднего срока службы жестких дисков до отказа, и они следующие:


Когда мы впервые увидели средний возраст отказов безопасного восстановления данных, мы подумали, что два года и 10 месяцев — это слишком мало. Мы были удивлены тем, что нам рассказали наши данные, но немного математики еще никому не повредило. Учитывая, что мы всегда добавляем дополнительные неисправные диски в наш набор данных и попутно выводим из эксплуатации модели дисков, мы продолжим отслеживать средний возраст отказов наших моделей дисков и сообщим, если обнаружим что-нибудь интересное.

Частота отказов жестких дисков за весь срок службы
По состоянию на 31 марта 2023 г. мы отслеживали 237 278 жестких дисков. Для нашего анализа жизненного цикла мы удалили 385 дисков, которые использовались только в целях тестирования или не имели по крайней мере 60 дисков. Таким образом, у нас остается 236 893 жестких диска, сгруппированных по 30 различным моделям, для анализа приведенной ниже таблицы срока службы.


Примечания и наблюдения о статистике жизни
Срок службы AFR для всех перечисленных выше дисков составляет 1,40%. Это незначительное увеличение по сравнению с предыдущим кварталом на 1,39%. Число AFR за весь срок службы для всех наших жестких дисков, по-видимому, составляет около 1,40%, хотя каждая модель диска имеет свое уникальное значение AFR.

В течение последних 10 лет мы собираем и храним данные Drive Stats, которые являются источником AFR за весь срок службы, перечисленных в таблице выше. Но зачем вообще отслеживать данные? Что ж, помимо создания этого отчета каждый квартал, мы используем данные для внутреннего использования, чтобы помочь нам вести наш бизнес. Хотя на решения, которые мы принимаем, влияет множество других факторов, данные Drive Stats помогают быстрее выявлять потенциальные проблемы, позволяют нам предпринимать более обоснованные действия, связанные с дисками, и в целом добавляют уровень уверенности в решениях, которые мы принимаем на основе дисков.

Backblaze Is 16!



Эй, мы можем водить! (Каламбур.) Иногда трудно поверить, что то, что начиналось как «сумасшедший» сон в квартире с одной спальней, превратилось в то, что мы празднуем сегодня — 16 лет сверкания (каламбур, кхм, тоже задумано).

Чтобы отметить это событие, мы решили поделиться некоторыми яркими моментами прошлых лет. Если вы хотите услышать, как соучредитель и генеральный директор Глеб Будман рассказывает о нашей эволюции (а также о том, как, по его мнению, будет развиваться облачное хранилище в будущем), ознакомьтесь с его недавним выступлением в подкасте Cloudcast.

И вот еще несколько замечательных моментов для вашего удовольствия от чтения и просмотра:
  • Вернёмся к этой статье, посвящённой нашей пятилетней годовщине — в ней есть несколько отличных фотографий.
  • Посмотрите наш самый первый вирусный момент, Петабайты с ограниченным бюджетом, и узнайте больше о наших модулях хранения в том виде, в каком они существуют сегодня.
  • Узнайте, как сообщество Backblaze объединилось для фарминга жестких дисков во время кризиса с накопителями в Таиланде.
  • Читайте о том, как нас чуть не купили; затем, позже, наше объявление об IPO и мысли о том, почему большему количеству компаний следует рассмотреть возможность выхода на биржу.
  • Покопайтесь в отчетах и данных Drive Stats с самого начала (10 лет назад!).
  • Просмотрите некоторые из наших технических материалов, таких как наша статья о стирающем кодировании Рида-Соломона, история Python Gil и балансировка нагрузки при управлении серверами.
Вы уже знаете, что в блоге Backblaze есть намного больше, и мы любим общаться с людьми в комментариях к статьям и в социальных сетях. Ведь без вас всех нас бы не было!

Спасибо, что поддерживали нас на протяжении многих лет. Если вам хочется распространять любовь, вы всегда можете порекомендовать друга. (Вам будет предложено войти в систему, чтобы получить кредит за реферала.) Ваш друг получит месяц бесплатно, чтобы попробовать Backblaze, и когда они зарегистрируются, вы тоже получите один!

www.backblaze.com/blog/backblaze-is-16/

Статистика Backblaze Drive за 2022 год



По состоянию на 31 декабря 2022 года у нас в управлении было 235 608 дисков. Из этого числа было 4 299 загрузочных дисков и 231 309 дисков с данными. Этот отчет будет посвящен нашим дискам данных. Мы рассмотрим частоту отказов жестких дисков за 2022 г., сравним эти показатели с предыдущими годами и представим статистику отказов за весь срок службы для всех моделей жестких дисков, используемых в нашем центре обработки данных по состоянию на конец 2022 г. Попутно мы поделитесь своими наблюдениями и выводами о представленных данных, и, как всегда, мы надеемся, что вы сделаете то же самое в разделе комментариев в конце поста.

Частота отказов жестких дисков в 2022г.
В конце 2022 года Backblaze отслеживала 231 309 жестких дисков, используемых для хранения данных. Для нашей оценки мы исключили из рассмотрения 388 дисков, которые использовались либо для целей тестирования, либо для моделей дисков, для которых у нас не было по крайней мере 60 дисков. Это оставляет нам 230 921 жесткий диск для анализа для этого отчета.


Наблюдения и примечания
Один ноль за год

В 2022 году только один накопитель Seagate емкостью 8 ТБ (модель: ST8000NM000A) не имел сбоев. Этот «ноль» имеет некоторые оговорки: у нас в эксплуатации всего 79 накопителей, а срок службы накопителя ограничен — 22 839 дней. Эти диски используются в качестве запасных для замены вышедших из строя дисков емкостью 8 ТБ.

Как насчет старых парней?
  • Жесткий диск Seagate емкостью 6 ТБ (модель: ST6000DX000) — самый старый в нашем парке со средним возрастом 92,5 месяца. В 2021 году его годовая частота отказов (AFR) составляла всего 0,11%, но к 2022 году он немного снизился до 0,68%. Очень приличный показатель в любое время, но особенно после почти восьми лет службы.
  • Средний возраст накопителей Toshiba емкостью 4 ТБ (модель: MD04ABA400V) составляет 91,3 месяца. В 2021 году этот диск имеет AFR 2,04%, а в 2022 году он подскочил до 3,13%, включая три отказа диска. Учитывая ограниченное количество дисков и дней вождения для этой модели, если бы в 2022 году произошло только два отказа дисков, AFR составил бы 2,08%, или почти такой же, как в 2021 году.
  • Обе эти модели дисков имеют относительно небольшое количество дней вождения, поэтому достоверность показателей AFR является спорной. Тем не менее, оба диска хорошо себя зарекомендовали на протяжении всего срока службы.

Новые модели
В 2022 году мы добавили пять новых моделей, отказавшись от нуля, что дало нам в общей сложности 29 различных моделей, которые мы отслеживаем. Вот пять новых моделей:
  • HUH728080ALE604–8 ТБ
  • ST8000NM000A–8 ТБ
  • ST16000NM002J–16ТБ
  • MG08ACA16TA–16ТБ
  • WUH721816ALE6L4–16 ТБ
Две модели дисков емкостью 8 ТБ используются для замены неисправных дисков емкостью 8 ТБ. Три модели накопителей емкостью 16 ТБ дополняют ассортимент.

Сравнение статистики дисков за 2020, 2021 и 2022 годы
На приведенной ниже диаграмме сравниваются AFR за каждый из последних трех лет. Данные за каждый год включают только этот год и рабочие модели приводов, представленные на конец каждого года.


Выход из строя привода произошел в 2022 году
После небольшого увеличения AFR с 2020 по 2021 год произошло более заметное увеличение AFR в 2022 году с 1,01% в 2021 году до 1,37%. Что случилось? В наших ежеквартальных отчетах о статистике накопителей за второй квартал 2022 г. и третий квартал 2022 г. мы отметили увеличение общего показателя AFR по сравнению с предыдущим кварталом и объяснили это старением парка накопителей. Но так ли это на самом деле? Давайте рассмотрим некоторые действующие факторы, которые могут вызвать рост AFR в 2022 году. Начнем с размера диска.

Размер диска и сбой диска
На приведенной ниже диаграмме сравниваются AFR 2021 и 2022 для наших больших дисков (которые мы определили как диски емкостью 12 ТБ, 14 ТБ и 16 ТБ) с нашими меньшими дисками (которые мы определили как диски емкостью 4 ТБ, 6 ТБ, 8 ТБ и 10 ТБ).


За исключением дисков емкостью 16 ТБ, AFR каждого размера увеличился с 2021 по 2022 год. В случае с небольшими дисками увеличение было заметным, и 2,12% значительно превышают AFR 1,37% для 2022 года для всех дисков. диски.

Кроме того, хотя на когорту небольших дисков приходится всего 28,7% дней работы в 2022 году, на них приходится 44,5% отказов дисков. Наши меньшие диски выходят из строя чаще, но они также старше, поэтому давайте рассмотрим это подробнее.

Возраст диска и сбой диска
При изучении корреляции возраста диска и отказа диска мы должны начать с нашего предыдущего взгляда на кривую ванны отказа жесткого диска. Там мы пришли к выводу, что диски, как правило, чаще выходят из строя по мере их старения. Чтобы увидеть, имеет ли это значение здесь, мы начнем с таблицы ниже, в которой показан средний возраст каждой модели дисков по размеру.


За исключением дисков Seagate емкостью 8 ТБ (модель: ST8000NM000A), которые мы недавно приобрели в качестве замены вышедшим из строя дискам емкостью 8 ТБ, диски аккуратно попадают в две указанные выше группы — 10 ТБ и меньше и 12 ТБ и выше.

Теперь давайте сгруппируем отдельные модели накопителей в когорты, определяемые размером накопителя. Но прежде чем мы это сделаем, мы должны помнить, что модели дисков емкостью 6 ТБ и 10 ТБ имеют относительно небольшое количество дисков и дисковых дней по сравнению с остальными группами дисков. Кроме того, когорты дисков емкостью 6 ТБ и 10 ТБ состоят из одной модели дисков, а в другие группы дисков входят как минимум четыре разные модели дисков. Тем не менее их исключение кажется неполным, поэтому мы включили таблицы с когортами дисков 6 ТБ и 10 ТБ и без них.


В каждой таблице показано соотношение для каждого размера диска между средним возрастом дисков и связанным с ними AFR. Диаграмма справа (V2) ясно показывает, что старые диски, сгруппированные по размеру, выходят из строя чаще. Это увеличение по мере старения модели привода соответствует кривой ванны, о которой мы говорили ранее.

Итак, что вызвало увеличение отказов дисков и имеет ли это значение?
Старение нашего парка жестких дисков кажется наиболее логичной причиной увеличения AFR в 2022 году. Мы могли бы копнуть глубже, но на данный момент это, вероятно, спорно. Видите ли, мы потратили 2022 год на развитие нашего присутствия в двух новых центрах обработки данных: объекте Nautilus в Стоктоне, штат Калифорния, и объекте CoreSite в Рестоне, штат Вирджиния. Ожидается, что в 2023 году мы сосредоточимся на замене старых дисков на жесткие диски емкостью 16 ТБ и больше. Диски на 4 ТБ и да, даже наш O.G. Диски Seagate емкостью 6 ТБ могут пойти. Мы будем держать вас в курсе.

Отказы дисков по производителям
Мы рассмотрели отказы дисков по возрасту и размеру дисков, поэтому правильнее рассматривать отказы дисков по производителям. Ниже мы нанесли ежеквартальный AFR за последние три года по производителям.


Начиная с первого квартала 2021 г. и до конца 2022 г., мы видим, что общий рост общего показателя AFR за это время, по-видимому, обусловлен Seagate и, в меньшей степени, Toshiba, хотя HGST вносит значительный вклад в первый квартал 2022 г. рост. В случае с Seagate это имеет смысл, поскольку большинство наших дисков Seagate значительно старше, чем диски любых других производителей.

Прежде чем выбросить свои диски Seagate и Toshiba в мусорное ведро, вы можете рассмотреть стоимость жизненного цикла данной модели жесткого диска по сравнению с частотой его отказов. Мы рассмотрели это в нашем отчете о статистике накопителей за третий квартал 2022 года и обрисовали компромиссы между стоимостью накопителей и количеством отказов. Например, в целом диски Seagate дешевле, а частота их отказов в нашей среде обычно выше. Но частота их отказов, как правило, недостаточно высока, чтобы сделать их менее рентабельными в течение всего срока службы. Вы могли бы привести убедительные доводы в пользу того, что для нас многие модели накопителей Seagate так же экономичны, как и более дорогие накопители. Помогает то, что наша платформа облачного хранилища B2 создана с учетом отказа дисков, но мы признаем, что меньшее количество отказов дисков никогда не бывает плохим.

Статистика жесткого диска за весь срок службы
В таблице ниже указан срок службы AFR всех моделей приводов, находящихся в производстве по состоянию на 31 декабря 2022 г.


Текущий показатель AFR за весь срок службы составляет 1,39%, что меньше, чем год назад (1,40%), а также меньше, чем в прошлом квартале (1,41%). AFR за весь срок службы менее подвержен быстрым изменениям из-за временных колебаний отказов накопителя и является хорошим индикатором AFR модели накопителя. Но чтобы быть уверенным в этом, требуется немало наблюдений (в нашем случае — дней езды). С этой целью в приведенной ниже таблице показаны только те модели дисков, которые накопили один миллион дней работы или более за свой срок службы. Мы упорядочили список по дням поездки.


Наконец, мы собираемся здесь немного раскрыться и поделиться результатами 388 дисков, которые мы исключили из нашего анализа, поскольку они были тестовыми дисками или моделями дисков с 60 или менее дисками. Эти диски разделены на 20 различных моделей дисков, и в таблице ниже перечислены модели дисков, которые работали в наших центрах обработки данных по состоянию на 31 декабря 2022 года. Большое предостережение: это всего лишь тестовые диски и так далее, так что будьте осторожны. Мы обычно игнорируем их в отчетах, так что это их шанс проявить себя или нет. Мы с нетерпением ждем ваших комментариев.


Есть много причин, по которым эти накопители дошли до этого момента в карьере Backblaze, но мы сохраним эти истории для другого раза. На данный момент мы просто делимся данными, чтобы быть откровенными, но, безусловно, есть что рассказать. Следите за обновлениями.

Версия SSD: обзор статистики накопителей за 2022



Добро пожаловать в выпуск SSD 2022 из серии Backblaze Drive Stats. Версия SSD ориентирована на твердотельные накопители (SSD), которые мы используем в качестве загрузочных дисков для серверов хранения данных на нашей платформе облачного хранения. Это отличается от наших традиционных отчетов Drive Stats, в которых основное внимание уделяется нашим жестким дискам (HDD), используемым для хранения данных клиентов.

Мы начали использовать твердотельные накопители в качестве загрузочных дисков, начиная с четвертого квартала 2018 года. С тех пор твердотельные накопители были установлены на всех новых серверах хранения и на всех неисправных загрузочных жестких дисках. Загрузочные диски в нашей среде выполняют гораздо больше функций, чем просто загружают серверы хранения. Каждый день они также читают, записывают и удаляют файлы журналов и временные файлы, создаваемые самим сервером хранения. Рабочая нагрузка одинакова для всех SSD, включенных в этот отчет.

В этом отчете мы рассматриваем частоту отказов твердотельных накопителей, которые мы используем в наших серверах хранения, на 2022 год, за последние 3 года и на весь срок службы твердотельных накопителей. Кроме того, мы впервые рассматриваем температуру наших твердотельных накопителей на 2022 год и сравниваем температуру твердотельных накопителей и жестких дисков, чтобы увидеть, действительно ли твердотельные накопители работают медленнее.

По состоянию на 31 декабря 2022 г. в качестве загрузочных дисков на наших серверах хранения использовалось 2906 твердотельных накопителей. Было использовано 13 различных моделей, большинство из которых считаются потребительскими твердотельными накопителями, и мы коснемся того, почему мы используем потребительские твердотельные накопители, чуть позже. В этом отчете мы покажем годовую частоту отказов (AFR) для этих моделей приводов за различные периоды времени, сделав наблюдения и сделав оговорки, чтобы помочь интерпретировать представленные данные.

Набор данных, на котором основан этот отчет, доступен для загрузки на нашей веб-странице тестовых данных Drive Stats. Данные SSD объединяются с данными HDD в одних и тех же файлах. К сожалению, сами данные не различают типы дисков SSD и HDD, поэтому вам нужно использовать поле модели, чтобы сделать это различие. Если вы просто ищете данные SSD, начните с Q4 2018 и продолжайте.

Ежегодная частота отказов твердотельных накопителей за 2022
Как уже отмечалось, на конец 2022 года в наших серверах хранения в эксплуатации находилось 2 906 твердотельных накопителей. В таблице ниже приведены данные за 2022 год. Позже мы сравним данные за 2022 год с предыдущими годами.


Наблюдения и предостережения
  • На 2022 год у семи из 13 моделей накопителей не было сбоев. Шесть из семи моделей имели ограниченное количество дней эксплуатации — менее 10 000 — а это означает, что данных недостаточно, чтобы сделать надежный прогноз частоты отказов этих моделей дисков.
  • Твердотельный накопитель Dell (модель: DELLBOSS VD) не имеет сбоев в 2022 году и имеет более 100 000 рабочих дней в году. Полученный AFR превосходен, но это твердотельный накопитель M.2, установленный на карту PCIe (форм-фактор половинной длины и половинной высоты), предназначенный для серверных развертываний, и поэтому он может быть недоступен. Кстати, BOSS расшифровывается как Boot Optimized Storage Solution.
  • Помимо твердотельного накопителя Dell, еще три модели накопителей имеют более 100 000 рабочих дней в году, поэтому данных достаточно, чтобы оценить интенсивность их отказов. Из трех моделей Seagate (модель: ZA250CM10003, он же: Seagate BarraCuda 120 SSD ZA250CM10003) имеет самый низкий AFR — 0,73%, Crucial (модель: CT250MX500SSD1) — следующий с AFR 1,04% и, наконец, Seagate (( модель: ZA250CM10002, она же: Seagate BarraCuda SSD ZA250CM10002) обеспечивает AFR 1,98% на 2022 год.

Ежегодная частота отказов твердотельных накопителей на 2020, 2021 и 2022 годы
На приведенной выше годовой диаграмме за 2022 год представлены данные о событиях, которые произошли только в 2022 году. Ниже мы сравниваем годовые данные за 2022 год с годовыми данными за 2020 и 2021 годы (соответственно), где данные за каждый год представляют только события, произошедшие в этот период.


Наблюдения и предостережения
  • Как и ожидалось, диски Crucial (модель: CT250MX500SSD1) хорошо восстановились в 2022 году после нескольких ранних сбоев в 2021 году. Мы ожидаем, что эта тенденция сохранится.
  • В 2022 году были представлены четыре новые модели, хотя ни у одной из них не было достаточного количества дней вождения, чтобы выявить какие-либо закономерности, хотя по состоянию на конец 2022 года ни одна из четырех моделей не вышла из строя.
  • Два из 250-гигабайтных дисков Seagate использовались все три года, но они развивались в разных направлениях. Жесткий диск Seagate (модель: ZA250CM10003) за все три года показал показатель AFR менее 1%. В то время как AFR для диска Seagate (модель: ZA250CM10002) снизился в 2022 году почти до 2%. Модель ZA250CM10003 новее двух примерно на год. В остальном разница незначительна, за исключением того, что ZA250CM10003 потребляет меньше энергии в режиме ожидания, 116 мВт против 185 мВт у ZA250CM10002. Будет интересно посмотреть, как поведет себя младшая модель в следующем году. Будет ли он следовать тенденции своего старшего брата и начнет чаще терпеть неудачи, или же он проложит свой собственный курс?

Температура SSD и AFR: первый взгляд
Прежде чем мы перейдем к частоте отказов SSD за весь срок службы, давайте поговорим о статистике SSD SMART. Здесь, в Backblaze, мы уже несколько месяцев боремся со статистикой SSD SMART, и одна вещь, которую мы обнаружили, заключается в том, что атрибуты или даже названия, которые производители SSD используют для записи своих различных данных SMART, не очень последовательны. Например, такие термины, как выравнивание износа, выносливость, срок службы, срок службы, записанные LBA, прочитанные LBA и т. д., используются разными производителями непоследовательно, часто с использованием разных атрибутов SMART, а иногда они вообще не записываются.

Одним из атрибутов SMART, который кажется постоянным (почти), является температура диска. SMART 194 (необработанное значение) записывает внутреннюю температуру SSD в градусах Цельсия. Мы говорим «почти», потому что твердотельный накопитель Dell (модель: DELLBOSS VD) не сообщает необработанные или нормализованные значения для SMART 194. На приведенной ниже диаграмме показана среднемесячная температура для остальных твердотельных накопителей, находящихся в эксплуатации в течение 2022 года.



Наблюдения и предостережения
  • В среднем в месяц производилось 67 724 наблюдения, от 57 015 в феврале до 77 174 в декабре. В 2022 году средняя температура за этот период изменилась всего на один градус Цельсия от минимального значения 34,4 градуса Цельсия до максимального значения 35,4 градуса Цельсия.
  • В 2022 году средняя температура составила 34,9 градуса по Цельсию. Средняя температура жестких дисков в тех же серверах хранения за тот же период составила 29,1 градуса Цельсия. Эта разница, кажется, идет вразрез с общепринятым мнением, согласно которому твердотельные накопители работают холоднее, чем жесткие диски. Одна из возможных причин заключается в том, что на всех наших серверах хранения загрузочные диски находятся дальше от холодного прохода, чем диски с данными. То есть диски с данными первыми получают холодный воздух. Если у вас есть какие-либо мысли, дайте нам знать в комментариях.
  • Колебание температуры на всех дисках в 2022 году колебалось от 20 градусов Цельсия (четыре наблюдения) до 61 градуса Цельсия (одно наблюдение). На приведенной ниже диаграмме показаны наблюдения за твердотельными накопителями в этом диапазоне температур.



Форма кривой должна выглядеть знакомо: это колоколообразная кривая. Мы видели тот же тип кривой при построении графика температуры жестких дисков сервера хранения. Кривая SSD предназначена для всех работающих SSD-накопителей, кроме SSD-накопителей Dell. Мы попытались построить такую же кривую для отказавших твердотельных накопителей, но с учетом всего 25 отказов в 2022 году кривая была бессмысленной.

Частота отказов твердотельных накопителей за весь срок службы
Частота отказов за весь срок службы основана на данных за все время эксплуатации данной модели диска в нашей системе. Эти данные относятся к четвертому кварталу 2018 года, хотя большая часть накопителей была введена в эксплуатацию за последние три года. В таблице ниже показан срок службы AFR для всех моделей SSD-накопителей, находящихся в эксплуатации по состоянию на конец 2022 года.


Наблюдения и предостережения
Общий AFR за весь срок службы составлял 0,89% на конец 2022 г. Это ниже, чем AFR за весь срок службы, составлявший 1,04% на конец 2021 г.
Существует несколько очень больших доверительных интервалов. Это связано с ограниченным объемом данных (дней вождения) для этих моделей дисков. Например, для модели WDC WD Blue SA510 2.5 всего 104 дня вождения. По мере накопления большего количества данных эти доверительные интервалы должны становиться более точными.
Нам нравится видеть доверительный интервал 1,0% или меньше для данной модели привода. Только три модели приводов соответствовали этому критерию:
  • Модель Dell DELLBOSS VD: срок службы AFR–0,00 %
  • Модель Seagate ZA250CM10003: срок службы AFR–0,66 %
  • Модель Seagate ZA250CM10002: срок службы AFR–0,96 %
Твердотельный накопитель Dell, как отмечалось ранее в этом отчете, представляет собой твердотельный накопитель M.2, установленный на карту PCIe, и может быть недоступен в широкой продаже. Два диска Seagate являются твердотельными накопителями потребительского уровня. В нашем случае для наших нужд подойдет менее дорогой SSD потребительского уровня, так как на загрузочном диске нет данных клиента, только загрузочные файлы, а также файлы журнала и временные файлы. Совсем недавно, когда мы приобрели серверы хранения у Supermicro и Dell, они объединяют все компоненты вместе по цене за единицу за сервер хранения. Если этот комплект включает твердотельные накопители корпоративного класса или твердотельный накопитель M.2 на карте PCIe, нас это устраивает.

Данные статистики SSD
Мы признаем, что 2906 твердотельных накопителей — это относительно небольшое количество дисков, на которых можно проводить наш анализ, и хотя это число приводит к более широким, чем хотелось бы, доверительным интервалам, это только начало. Разумеется, мы продолжим добавлять в учебную группу загрузочные SSD-накопители, что повысит достоверность представленных данных. Тем временем мы ожидаем, что наши читатели оценят представленные данные со своей обычной скептической точки зрения и будут использовать их соответствующим образом.

Полный набор данных, использованный для создания информации, используемой в этом обзоре, доступен на нашей странице данных тестирования жесткого диска. Как отмечалось ранее, вы найдете данные SSD и HDD в одних и тех же файлах, и вам придется использовать номер модели, чтобы отличить одну запись от другой. Вы можете скачать и использовать эти данные бесплатно в своих целях. Все, что мы просим, это три вещи: 1) вы указываете Backblaze в качестве источника, если вы используете данные, 2) вы соглашаетесь с тем, что вы несете единоличную ответственность за то, как вы используете данные, и 3) вы никому не продаете эти данные; это бесплатно.
www.backblaze.com/b2/hard-drive-test-data.html

Удачи, и дайте нам знать, если вы найдете что-нибудь интересное.

Статистика Backblaze Drive за 3 квартал 2022

По состоянию на конец третьего квартала 2022 года Backblaze отслеживала 230 897 жестких дисков и твердотельных накопителей в наших центрах обработки данных по всему миру. Из этого числа 4200 являются загрузочными дисками, из них 2778 твердотельных накопителей и 1422 жестких диска. Ранее твердотельные накопители были рассмотрены в нашем недавно опубликованном полугодовом отчете о твердотельных накопителях. Сегодня мы сосредоточимся на 226 697 дисках с данными, находящихся под управлением, и проанализируем их ежеквартальную и пожизненную частоту отказов по состоянию на конец третьего квартала 2022 года.

Мы также рассмотрим взаимосвязь между частотой отказов жестких дисков и стоимостью жестких дисков. Попутно мы будем делиться нашими наблюдениями и выводами о представленных данных, и, как всегда, мы надеемся, что вы сделаете то же самое в разделе комментариев в конце поста.

Показатели отказов жестких дисков в третьем квартале 2022 г.
Начнем с обзора наших данных за третий квартал 2022 года. В этом квартале мы отследили 226 697 жестких дисков, используемых для хранения данных. Для нашей оценки мы исключили из рассмотрения 388 дисков, поскольку они использовались для целей тестирования или модели дисков, в которых не было по крайней мере 60 дисков. Это оставляет нам 226 309 жестких дисков, сгруппированных по 29 различным моделям для анализа.



Примечания и наблюдения по статистике за второй квартал 2022 года
Ноль сбоев в третьем квартале. В этом квартале не было сбоев у трех дисков: HGST 8 ТБ (модель: HUH728080ALE604), Seagate 8 ТБ (модель: ST8000NM000A) и WDC 16 ТБ (модель: WUH721816ALE6L0). Для HGST на 8 ТБ это был второй квартал подряд без сбоев. Из трех только модель WDC имеет достаточно данных за весь срок службы (дней в пути), чтобы ее можно было использовать с расчетной годовой интенсивностью отказов (AFR). Как мы увидим позже в этом обзоре, эта модель WDC на 14 ТБ имеет AFR за весь срок службы 0,11% с диапазоном доверительного интервала всего 0,30 при доверительном уровне 95%.

Новые диски в городе. В данных этого квартала есть две новые модели: Seagate емкостью 8 ТБ (модель: ST8000NM000A) и Seagate емкостью 16 ТБ (модель: ST16000NM002J). Ни у того, ни у другого пока нет достаточно данных, чтобы быть интересными, но, как отмечалось выше, у Seagate емкостью 8 ТБ не было ни одного сбоя в первом квартале эксплуатации. Эти дополнения дают нам 29 различных моделей, которые мы отслеживаем, по сравнению с 27 в предыдущем квартале.

29 моделей разбиты по производителям следующим образом:
  • HGST: 7 моделей
  • Seagate: 13 моделей
  • Тошиба: 6 моделей
  • ВДК: 3 модели
На приведенной ниже диаграмме показано изменение нашего парка приводов за последние шесть лет в разбивке по производителям.


Старая гвардия чувствует себя старой: все три самых старых диска, которые мы используем в настоящее время, демонстрируют признаки своего возраста, поскольку каждый из них испытал увеличение AFR со второго по третий квартал 2022 года, как показано ниже.



Обратите внимание, что у Toshiba емкостью 4 ТБ в третьем квартале 2022 года было только два сбоя. Высокий показатель AFR (8,25%) связан с ограниченным количеством дней работы в квартале (8 849) всего с 95 дисками. Кажется, что у всех трех шпиндели, приводы и носители начинают изнашиваться примерно после семи лет постоянного вращения.

Квартальный AFR продолжает расти: AFR за третий квартал 2022 года составил 1,64%, увеличившись с 1,46% во втором квартале 2022 года и с 1,10% год назад. Как отмечалось ранее, это связано со старением всего парка приводов, и мы ожидаем, что это число уменьшится по мере того, как старые приводы будут выведены из эксплуатации и заменены в течение следующего года. Возможным предвестником того, что грядет, являются модели емкостью 16 ТБ, у которых в третьем квартале 2022 года показатель AFR составил 0,80 %. Поскольку эти диски используются для замены устаревших дисков емкостью 4 ТБ, квартальный показатель AFR должен снизиться.

Отказ жесткого диска по сравнению со стоимостью жесткого диска
Один из вопросов, который возникает, заключается в том, почему мы будем продолжать покупать модель накопителя, которая имеет более высокую годовую частоту отказов по сравнению с моделью сопоставимого размера, но более дорогой. Две основные причины: во-первых, мы можем это сделать, поскольку архитектура нашего облачного хранилища Backblaze Vault рассчитана на сбой диска. Во-вторых, изучая данные, такие как статистика дисков и тому подобное, мы усердно работаем, чтобы понять нашу среду изнутри. Понимание взаимосвязи между стоимостью и отказом диска является одним из таких уроков. Ниже приведен простой пример с использованием трех вымышленных моделей дисков емкостью 14 ТБ: Модель 1, Модель 2 и Модель 3.


Давайте посмотрим на разные разделы (т.е. синие строки) этой таблицы.

Стоимость диска: у каждой модели своя цена: низкая (225 долларов), средняя (250 долларов) и высокая (275 долларов). Мы бы купили одинаковое количество дисков (5000) каждой модели и получили бы стоимость каждой модели.

Годовой отказ привода: это показатель AFR для каждой модели привода. В этом примере мы присвоили модель с самой низкой ценой самой высокой частоте отказов, модель с самой высокой ценой — самой низкой частоте отказов и так далее. На практике мы будем использовать наши собственные номера AFR для данной модели, которую мы рассматриваем для покупки. Несмотря на это, мы получаем годовое количество отказавших дисков для каждой модели.

Ежегодные затраты на замену: затраты на рабочую силу покрывают человеческие затраты, связанные с выявлением неисправности, возвратом и заменой диска. Стоимость диска здесь равна нулю, поскольку предполагается, что все диски возвращаются для кредита или замены производителю или его агенту. Нулевое значение здесь может быть не всегда; отсюда и позиция. В любом случае вычисляются ежегодные затраты на замену отказавших дисков для каждой модели.

Стоимость замены в течение всего срока службы. Умножьте количество лет, в течение которых вы ожидаете, что модель диска будет служить, на ежегодные затраты на замену отказавших дисков. Все это дает нам общую стоимость каждой модели привода — персикового раздела. В нашем примере самая дорогая модель (модель 3) является самым дорогим приводом в течение пятилетнего ожидаемого срока службы, а самая дешевая модель привода (модель 1) является наименее дорогой за тот же период, даже при более высокой частоте отказов в годовом исчислении..

Но мы еще не закончили. Следующий вопрос: какой должна быть годовая частота отказов для наименее дорогостоящего варианта, модели 1, чтобы общая стоимость через пять лет была такой же, как у модели 2, а затем у модели 3? Другими словами, сколько неудач мы можем терпеть, прежде чем наше первоначальное решение о покупке окажется неверным? Когда мы подсчитываем цифры, мы получаем следующее:
  • Модель 1 и Модель 2 имеют одинаковую общую стоимость привода (1 325 000 долл. США), если годовая частота отказов для Модели 1 составляет 2,67%.
  • Модель 1 и Модель 3 имеют одинаковую общую стоимость привода (1 412 500 долл. США), если годовая частота отказов для Модели 1 составляет 3,83%.
Представленная модель представляет собой упрощенную версию того, как мы думаем о решениях о покупке дисков, используя годовую частоту отказов дисков как часть уравнения. Вы можете сделать эту модель более точной и сложной, добавив изменения частоты отказов дисков с течением времени (кривая ванны) и пропорционально распределив стоимость возврата неисправных дисков с годами. Нужно ли это, решать вам.

Необходимость такой модели важна в нашем бизнесе, если вы заинтересованы в оптимизации эффективности вашей платформы облачного хранения. В противном случае, просто роботизированная покупка самых дорогих или наименее дорогих дисков означает закрытие глаз на расходную часть бухгалтерской книги.

На уровне индивидуального или небольшого офиса/домашнего офиса ваше решение о покупке диска требует гораздо меньше математики и часто сводится к тому, какой диск вы можете себе позволить. Тем не менее, вы все равно должны попытаться провести некоторые исследования. Наша статистика дисков может помочь, но в любом случае у вас должен быть надежный план резервного копирования, поскольку ни один диск, который вы можете купить, не является надежным.

Частота отказов жестких дисков за весь срок службы
По состоянию на 30 сентября 2022 года Backblaze отслеживала 226 697 жестких дисков, используемых для хранения данных. Для нашей оценки мы исключили из рассмотрения 388 дисков, поскольку они использовались для целей тестирования или модели дисков, в которых не было по крайней мере 60 дисков. Таким образом, у нас остается 226 309 жестких дисков, сгруппированных по 29 различным моделям, для анализа отчета о сроке службы.


Примечания и наблюдения о статистике жизни
Годовая частота отказов за весь срок службы для всех перечисленных выше дисков составляет 1,41%. Это небольшое увеличение по сравнению с предыдущим кварталом на 1,39%, но ниже, чем год назад (3 квартал 2021 г.), который составлял 1,45%.

Обычную осторожность следует применять к тем моделям дисков, которые имеют широкие доверительные интервалы, один процент или больше. Такой разрыв указывает на то, что данных недостаточно или что данные, которые у нас есть, трудно предсказать.

Тем не менее, у нас есть множество моделей накопителей, по которым у нас есть достоверные данные. Ниже мы извлекли модели 12 ТБ, 14 ТБ и 16 ТБ из приведенной выше таблицы срока службы, у которых показатель AFR за весь срок службы составляет менее 1 %, а доверительный интервал — 0,5 % или менее. Это жесткие диски, которые до этого момента демонстрировали стабильную надежность в нашей среде.


Данные статистики жесткого диска
Полный набор данных, использованных для создания информации в этом обзоре, доступен на нашей странице данных тестирования жесткого диска. Вы можете скачать и использовать эти данные бесплатно в своих целях. Все, что мы просим, это три вещи: 1) вы указываете Backblaze в качестве источника, если вы используете данные, 2) вы соглашаетесь с тем, что вы несете единоличную ответственность за то, как вы используете данные, и 3) вы никому не продаете эти данные; это свободно.

Если вам нужны таблицы и диаграммы, используемые в этом отчете, вы можете загрузить файл .zip из облачного хранилища Backblaze B2, который содержит файлы .jpg и/или .xlsx, если применимо.