В конце второго квартала 2023 года Backblaze отслеживала 245 757 жестких дисков и твердотельных накопителей в наших центрах обработки данных по всему миру. Из этого числа 4460 являются загрузочными дисками, 3144 — твердотельными накопителями и 1316 — жесткими дисками. Частота отказов твердотельных накопителей анализируется в обзоре SSD Edition: 2022 Drive Stats.
Сегодня мы сосредоточимся на 241 297 накопителях данных, находящихся под управлением, и проанализируем их ежеквартальную и пожизненную частоту отказов по состоянию на конец второго квартала 2023 года. некоторые дополнительные поля данных, которые мы теперь включаем, и многое другое.
Частота отказов жестких дисков за второй квартал 2023 г.
В конце второго квартала 2023 года мы управляли 241 297 жесткими дисками, используемыми для хранения данных. Для нашего обзора мы исключили из рассмотрения 357 накопителей, поскольку они использовались для целей тестирования или моделей накопителей, в которых не было по крайней мере 60 дисков. Это оставляет нам 240 940 жестких дисков, сгруппированных в 31 модель. В таблице ниже приведена годовая частота отказов (AFR) для этих моделей накопителей за второй квартал 2023 года.
Примечания и наблюдения по статистике привода за второй квартал 2023 г.
Отсутствие отказов. Во втором квартале 2023 г. было шесть моделей накопителей без отказов, как показано в таблице ниже.
Таблица отсортирована по количеству дней вождения каждой модели за квартал. Как правило, модель вождения должна иметь не менее 50 000 дней вождения в квартале, чтобы быть статистически значимой. Все три ведущих диска соответствуют этому критерию, и отсутствие сбоев за квартал неудивительно, учитывая, что AFR за весь срок службы для трех дисков колеблется от 0,13% до 0,45%. Ни один из трех нижних дисков не накопил 50 000 дней работы в квартале, но два диска Seagate показали хороший старт. И всегда приятно видеть, что Toshiba емкостью 4 ТБ (модель: MD04ABA400V) с восемью годами службы не имеет ни одного сбоя за квартал.
Самый старый диск? Моделью диска с самым старым средним возрастом по-прежнему является Seagate емкостью 6 ТБ (модель: ST6000DX000) с возрастом 98,3 месяца (8,2 года), а возраст самого старого диска в этой когорте составляет 104 месяца (8,7 года).
Самым старым рабочим накопителем данных в парке является Seagate емкостью 4 ТБ (модель: ST4000DM000) с возрастом 105,2 месяца (8,8 года). Это впечатляет, особенно в среде центра обработки данных, но победителем в номинации «Самый старый действующий диск в нашем парке» на самом деле является загрузочный диск: диск WDC емкостью 500 ГБ (модель: WD5000BPKT) со сроком службы 122 месяца (10,2 года).
Повышение AFR: AFR во втором квартале 2023 г. составил 2,28% по сравнению с 1,54% в первом квартале 2023 г. Хотя квартальные показатели AFR могут быть неустойчивыми, они также могут быть полезны для выявления тенденций, требующих дальнейшего изучения. В данном случае рост был ожидаем, так как возраст нашего флота продолжает увеличиваться. Но было ли это настоящей причиной?
Углубившись, мы начнем с годовой частоты отказов и среднего возраста наших дисков, сгруппированных по размеру диска, как показано в таблице ниже.
Для нашей цели мы определим диск как старый, если ему исполнилось пять или более лет. Почему? Это гарантийный срок дисков, которые мы покупаем сегодня. Конечно, на диски емкостью 4 ТБ и 6 ТБ, а также на некоторые из дисков емкостью 8 ТБ распространяется только двухлетняя гарантия, но для согласованности мы будем придерживаться пяти лет в качестве точки, по достижении которой диск помечается как «старый».
Использование нашего определения для старых дисков исключает диски емкостью 12 ТБ, 14 ТБ и 16 ТБ. Это оставляет нам приведенную ниже диаграмму ежеквартального AFR за последние три года для каждой группы старых дисков, моделей емкостью 4 ТБ, 6 ТБ, 8 ТБ и 10 ТБ.
Интересно, что самые старые диски емкостью 4 ТБ и 6 ТБ выдерживают свои испытания. Да, за последний год или около того произошло увеличение, но, учитывая их возраст, у них все хорошо.
С другой стороны, диски емкостью 8 ТБ и 10 ТБ со средним сроком службы пять и шесть лет соответственно требуют дополнительного внимания. Далее в этом отчете мы рассмотрим данные о продолжительности жизни, чтобы убедиться, что наши выводы оправданы.
Что нового в данных Drive Stats?
В течение последних 10 лет мы собираем и храним данные статистики дисков, а с 2015 года мы открыли исходный код файлов данных, которые мы использовали для создания отчетов статистики дисков. Время от времени в схему добавляются новые пары атрибутов SMART, поскольку мы устанавливаем новые модели дисков, которые сообщают о новых наборах атрибутов SMART. В этом квартале мы решили собрать и сохранить некоторые дополнительные поля данных о дисках и среде, в которой они работают, и добавили их в общедоступные файлы статистики дисков, которые мы публикуем каждый квартал.
Новые поля данных
Начиная с данных Drive Stats за Q2 2023, в каждой записи диска появляются три новых поля данных.
- Vault_id: все диски с данными являются членами хранилища Backblaze. Каждое хранилище состоит из 900 или 1200 жестких дисков, равномерно распределенных по 20 серверам хранения. Хранилище представляет собой числовое значение, начинающееся с 1000.
- Pod_id: в каждом хранилище Backblaze есть 20 серверов хранения. Pod_id — это числовое поле со значениями от 0 до 19, назначенное одному из 20 серверов хранения.
- Is_legacy_format: в настоящее время 0, но будет полезен в ближайшие кварталы по мере добавления дополнительных полей.
Новая схема выглядит следующим образом:
- date
- serial_number
- model
- capacity_bytes
- failure
- vault_id
- pod_id
- is_legacy_format
- smart_1_normalized
- smart_1_raw
- Remaining SMART value pairs (as reported by each drive model)
Оставшиеся пары значений SMART (согласно каждой модели диска)
Время от времени наши читатели спрашивали, есть ли у нас дополнительная информация о том, где живет диск и, что более важно, где он умер. Недавно добавленные поля данных выше являются частью внутренних данных о диске, которые мы собираем каждый день, но они не были включены в данные статистики диска, которые мы используем для создания отчетов статистики диска. С помощью Дэвида из нашей команды Infrastructure Software эти поля теперь будут доступны в данных Drive Stats.
Как мы можем использовать информацию о Vault и Pod?
Сначала предостережение: у нас есть ровно четверть этих новых данных. Хотя было заманчиво создавать диаграммы и таблицы, мы хотим увидеть данные за пару кварталов, чтобы лучше понять их. Ищите первоначальный анализ позже в этом году.
Тем не менее, эти данные дают нам сервер хранения и хранилище каждого диска. Работая в обратном направлении, мы должны иметь возможность задавать такие вопросы, как: «Являются ли определенные серверы хранения более склонными к отказу дисков?» или «Какие модели дисков лучше или хуже работают с определенными серверами хранения?» Кроме того, мы надеемся добавить такие элементы данных, как тип сервера хранения и центр обработки данных, чтобы предоставить дополнительную информацию о нашей платформе облачного хранилища с несколькими эксабайтами.
На протяжении многих лет мы использовали данные Drive Stats внутри компании, чтобы повысить эффективность работы и надежность. Предоставление этих новых элементов данных всем через наши отчеты Drive Stats и загрузку данных — это правильное решение.
В городе появился новый драйв
Если вы все же решите скачать наши данные Drive Stats за второй квартал 2023 года, вас ждет сюрприз — новая модель накопителя. Таких дисков всего четыре, поэтому их легко не заметить, и они не указаны ни в одной из таблиц и диаграмм, которые мы публикуем, поскольку на данный момент они считаются «тестовыми» дисками. Но если вы просматриваете данные, выполните поиск модели «WDC WUH722222ALE6L4», и вы найдете наши недавно установленные диски WDC емкостью 22 ТБ. Они прошли тестирование в конце второго квартала и проходят испытания, пока мы говорим. Следите за обновлениями. (Псс, по состоянию на 28.07 ни один не вышел из строя.)
Частота отказов жестких дисков за весь срок службы
По состоянию на 30 июня 2023 г. мы отслеживали 241 297 жестких дисков, используемых для хранения данных клиентов. Для нашего анализа жизненного цикла мы удалили 357 дисков, которые использовались только в целях тестирования или не имели по крайней мере 60 дисков, представленных в полном наборе данных. Таким образом, у нас остается 240 940 жестких дисков, сгруппированных по 31 модели, для анализа приведенной ниже таблицы срока службы.
Примечания и наблюдения о статистике жизни
Пожизненный AFR также повышается. Годовая частота отказов за весь срок службы для всех перечисленных выше дисков составляет 1,45 %. Это на 0,05% больше, чем в предыдущем квартале на 1,40%. Ранее в этом отчете, изучив данные за второй квартал 2023 года, мы определили диски емкостью 8 ТБ и 10 ТБ в качестве основных подозреваемых в увеличении скорости. Давайте посмотрим, сможем ли мы подтвердить это, изучив изменение показателей AFR за весь срок службы различных дисков, сгруппированных по размеру.
Красная линия — это наш базовый уровень, так как это разница между Q1 и Q2 (0,05%) AFR за весь срок службы для всех дисков. Диски выше красной линии поддерживают увеличение, диски ниже линии вычитают из увеличения. Основными дисками (по размеру), которые «движут» увеличенную годовую частоту отказов в течение всего срока службы, являются диски емкостью 8 ТБ и 10 ТБ. Это подтверждает то, что мы обнаружили ранее. Учитывая, что накопителей на 10 ТБ относительно немного (1124) по сравнению с дисками на 8 ТБ (24 891), давайте углубимся в модели дисков на 8 ТБ.
Пожизненная AFR для всех дисков емкостью 8 ТБ подскочила с 1,42% в первом квартале до 1,59% во втором квартале. Увеличение на 12%. В эксплуатации находится шесть моделей накопителей емкостью 8 ТБ, но на три из этих моделей приходится 99,5 % отказов дисков для когорты накопителей емкостью 8 ТБ, поэтому мы сосредоточимся на них. Они перечислены ниже.
Для всех трех моделей увеличение годовой частоты отказов за весь срок службы с Q1 по Q2 составляет 10 % или более, что статистически аналогично увеличению на 12 % для всех моделей накопителей емкостью 8 ТБ. Если бы вам нужно было выбрать одну модель накопителя, на которую нужно было бы сосредоточиться при миграции, любой из трех был бы хорошим кандидатом. Но диски Seagate модели ST8000DM002 в среднем почти на год старше других рассматриваемых моделей дисков.
Не совсем всю жизнь? В приведенной выше таблице анализируются данные за период с 20 апреля 2013 г. по 30 июня 2023 г., или 10 лет, 2 месяца и 10 дней. Как отмечалось ранее, самому старому диску, который у нас есть, 10 лет и 2 месяца, плюс-минус день или два. Казалось бы, нам нужно изменить заголовок нашей таблицы, но пока не совсем. Диск, который был установлен в любое время во втором квартале 2013 года и все еще работает сегодня, будет сообщать о днях работы диска как часть данных о сроке службы для этой модели. Как только все диски, установленные во втором квартале 2013 года, исчезнут, мы сможем соответствующим образом изменить дату начала в наших таблицах и диаграммах.
Несколько слов об отказе привода
Беспокоит ли нас увеличение количества отказов накопителей? Конечно, нам бы хотелось, чтобы они были ниже, но неизбежная реальность бизнеса облачных хранилищ заключается в том, что диски выходят из строя. За прошедшие годы мы наблюдали широкий диапазон частот отказов у разных производителей, моделей и размеров дисков. Если вы не готовы к этому, вы потерпите неудачу. В рамках нашей подготовки мы используем данные статистики дисков как один из многих входных данных для понимания нашей среды, чтобы мы могли корректировать, когда и как нам нужно.
Итак, нас беспокоит увеличение количества отказов накопителей? Нет, но мы и не высокомерны. Мы продолжим следить за нашими системами, при необходимости примем меры и по ходу дела поделимся с вами тем, что сможем.
Данные статистики жесткого диска
Полный набор данных, использованных для создания информации, используемой в этом обзоре, доступен на нашей веб-странице «Статистика жесткого диска». Вы можете скачать и использовать эти данные бесплатно в своих целях. Все, что мы просим, это три вещи: 1) вы указываете Backblaze в качестве источника, если вы используете данные, 2) вы соглашаетесь с тем, что вы несете единоличную ответственность за то, как вы используете данные, и 3) вы никому не продаете эти данные; это бесплатно.
Если вы хотите, чтобы таблицы и диаграммы использовались в этом отчете, вы можете загрузить ZIP-файл из облачного хранилища Backblaze B2, который содержит электронную таблицу MS Excel с вкладками для каждой из таблиц или диаграмм.
Удачи и дайте нам знать, если вы найдете что-нибудь интересное.