По состоянию на конец третьего квартала 2022 года Backblaze отслеживала 230 897 жестких дисков и твердотельных накопителей в наших центрах обработки данных по всему миру. Из этого числа 4200 являются загрузочными дисками, из них 2778 твердотельных накопителей и 1422 жестких диска. Ранее твердотельные накопители были рассмотрены в нашем недавно опубликованном полугодовом отчете о твердотельных накопителях. Сегодня мы сосредоточимся на 226 697 дисках с данными, находящихся под управлением, и проанализируем их ежеквартальную и пожизненную частоту отказов по состоянию на конец третьего квартала 2022 года.
Мы также рассмотрим взаимосвязь между частотой отказов жестких дисков и стоимостью жестких дисков. Попутно мы будем делиться нашими наблюдениями и выводами о представленных данных, и, как всегда, мы надеемся, что вы сделаете то же самое в разделе комментариев в конце поста.
Показатели отказов жестких дисков в третьем квартале 2022 г.
Начнем с обзора наших данных за третий квартал 2022 года. В этом квартале мы отследили 226 697 жестких дисков, используемых для хранения данных. Для нашей оценки мы исключили из рассмотрения 388 дисков, поскольку они использовались для целей тестирования или модели дисков, в которых не было по крайней мере 60 дисков. Это оставляет нам 226 309 жестких дисков, сгруппированных по 29 различным моделям для анализа.
Примечания и наблюдения по статистике за второй квартал 2022 года
Ноль сбоев в третьем квартале. В этом квартале не было сбоев у трех дисков: HGST 8 ТБ (модель: HUH728080ALE604), Seagate 8 ТБ (модель: ST8000NM000A) и WDC 16 ТБ (модель: WUH721816ALE6L0). Для HGST на 8 ТБ это был второй квартал подряд без сбоев. Из трех только модель WDC имеет достаточно данных за весь срок службы (дней в пути), чтобы ее можно было использовать с расчетной годовой интенсивностью отказов (AFR). Как мы увидим позже в этом обзоре, эта модель WDC на 14 ТБ имеет AFR за весь срок службы 0,11% с диапазоном доверительного интервала всего 0,30 при доверительном уровне 95%.
Новые диски в городе. В данных этого квартала есть две новые модели: Seagate емкостью 8 ТБ (модель: ST8000NM000A) и Seagate емкостью 16 ТБ (модель: ST16000NM002J). Ни у того, ни у другого пока нет достаточно данных, чтобы быть интересными, но, как отмечалось выше, у Seagate емкостью 8 ТБ не было ни одного сбоя в первом квартале эксплуатации. Эти дополнения дают нам 29 различных моделей, которые мы отслеживаем, по сравнению с 27 в предыдущем квартале.
29 моделей разбиты по производителям следующим образом:
- HGST: 7 моделей
- Seagate: 13 моделей
- Тошиба: 6 моделей
- ВДК: 3 модели
На приведенной ниже диаграмме показано изменение нашего парка приводов за последние шесть лет в разбивке по производителям.
Старая гвардия чувствует себя старой: все три самых старых диска, которые мы используем в настоящее время, демонстрируют признаки своего возраста, поскольку каждый из них испытал увеличение AFR со второго по третий квартал 2022 года, как показано ниже.
Обратите внимание, что у Toshiba емкостью 4 ТБ в третьем квартале 2022 года было только два сбоя. Высокий показатель AFR (8,25%) связан с ограниченным количеством дней работы в квартале (8 849) всего с 95 дисками. Кажется, что у всех трех шпиндели, приводы и носители начинают изнашиваться примерно после семи лет постоянного вращения.
Квартальный AFR продолжает расти: AFR за третий квартал 2022 года составил 1,64%, увеличившись с 1,46% во втором квартале 2022 года и с 1,10% год назад. Как отмечалось ранее, это связано со старением всего парка приводов, и мы ожидаем, что это число уменьшится по мере того, как старые приводы будут выведены из эксплуатации и заменены в течение следующего года. Возможным предвестником того, что грядет, являются модели емкостью 16 ТБ, у которых в третьем квартале 2022 года показатель AFR составил 0,80 %. Поскольку эти диски используются для замены устаревших дисков емкостью 4 ТБ, квартальный показатель AFR должен снизиться.
Отказ жесткого диска по сравнению со стоимостью жесткого диска
Один из вопросов, который возникает, заключается в том, почему мы будем продолжать покупать модель накопителя, которая имеет более высокую годовую частоту отказов по сравнению с моделью сопоставимого размера, но более дорогой. Две основные причины: во-первых, мы можем это сделать, поскольку архитектура нашего облачного хранилища Backblaze Vault рассчитана на сбой диска. Во-вторых, изучая данные, такие как статистика дисков и тому подобное, мы усердно работаем, чтобы понять нашу среду изнутри. Понимание взаимосвязи между стоимостью и отказом диска является одним из таких уроков. Ниже приведен простой пример с использованием трех вымышленных моделей дисков емкостью 14 ТБ: Модель 1, Модель 2 и Модель 3.
Давайте посмотрим на разные разделы (т.е. синие строки) этой таблицы.
Стоимость диска: у каждой модели своя цена: низкая (225 долларов), средняя (250 долларов) и высокая (275 долларов). Мы бы купили одинаковое количество дисков (5000) каждой модели и получили бы стоимость каждой модели.
Годовой отказ привода: это показатель AFR для каждой модели привода. В этом примере мы присвоили модель с самой низкой ценой самой высокой частоте отказов, модель с самой высокой ценой — самой низкой частоте отказов и так далее. На практике мы будем использовать наши собственные номера AFR для данной модели, которую мы рассматриваем для покупки. Несмотря на это, мы получаем годовое количество отказавших дисков для каждой модели.
Ежегодные затраты на замену: затраты на рабочую силу покрывают человеческие затраты, связанные с выявлением неисправности, возвратом и заменой диска. Стоимость диска здесь равна нулю, поскольку предполагается, что все диски возвращаются для кредита или замены производителю или его агенту. Нулевое значение здесь может быть не всегда; отсюда и позиция. В любом случае вычисляются ежегодные затраты на замену отказавших дисков для каждой модели.
Стоимость замены в течение всего срока службы. Умножьте количество лет, в течение которых вы ожидаете, что модель диска будет служить, на ежегодные затраты на замену отказавших дисков. Все это дает нам общую стоимость каждой модели привода — персикового раздела. В нашем примере самая дорогая модель (модель 3) является самым дорогим приводом в течение пятилетнего ожидаемого срока службы, а самая дешевая модель привода (модель 1) является наименее дорогой за тот же период, даже при более высокой частоте отказов в годовом исчислении..
Но мы еще не закончили. Следующий вопрос: какой должна быть годовая частота отказов для наименее дорогостоящего варианта, модели 1, чтобы общая стоимость через пять лет была такой же, как у модели 2, а затем у модели 3? Другими словами, сколько неудач мы можем терпеть, прежде чем наше первоначальное решение о покупке окажется неверным? Когда мы подсчитываем цифры, мы получаем следующее:
- Модель 1 и Модель 2 имеют одинаковую общую стоимость привода (1 325 000 долл. США), если годовая частота отказов для Модели 1 составляет 2,67%.
- Модель 1 и Модель 3 имеют одинаковую общую стоимость привода (1 412 500 долл. США), если годовая частота отказов для Модели 1 составляет 3,83%.
Представленная модель представляет собой упрощенную версию того, как мы думаем о решениях о покупке дисков, используя годовую частоту отказов дисков как часть уравнения. Вы можете сделать эту модель более точной и сложной, добавив изменения частоты отказов дисков с течением времени (кривая ванны) и пропорционально распределив стоимость возврата неисправных дисков с годами. Нужно ли это, решать вам.
Необходимость такой модели важна в нашем бизнесе, если вы заинтересованы в оптимизации эффективности вашей платформы облачного хранения. В противном случае, просто роботизированная покупка самых дорогих или наименее дорогих дисков означает закрытие глаз на расходную часть бухгалтерской книги.
На уровне индивидуального или небольшого офиса/домашнего офиса ваше решение о покупке диска требует гораздо меньше математики и часто сводится к тому, какой диск вы можете себе позволить. Тем не менее, вы все равно должны попытаться провести некоторые исследования. Наша статистика дисков может помочь, но в любом случае у вас должен быть надежный план резервного копирования, поскольку ни один диск, который вы можете купить, не является надежным.
Частота отказов жестких дисков за весь срок службы
По состоянию на 30 сентября 2022 года Backblaze отслеживала 226 697 жестких дисков, используемых для хранения данных. Для нашей оценки мы исключили из рассмотрения 388 дисков, поскольку они использовались для целей тестирования или модели дисков, в которых не было по крайней мере 60 дисков. Таким образом, у нас остается 226 309 жестких дисков, сгруппированных по 29 различным моделям, для анализа отчета о сроке службы.
Примечания и наблюдения о статистике жизни
Годовая частота отказов за весь срок службы для всех перечисленных выше дисков составляет 1,41%. Это небольшое увеличение по сравнению с предыдущим кварталом на 1,39%, но ниже, чем год назад (3 квартал 2021 г.), который составлял 1,45%.
Обычную осторожность следует применять к тем моделям дисков, которые имеют широкие доверительные интервалы, один процент или больше. Такой разрыв указывает на то, что данных недостаточно или что данные, которые у нас есть, трудно предсказать.
Тем не менее, у нас есть множество моделей накопителей, по которым у нас есть достоверные данные. Ниже мы извлекли модели 12 ТБ, 14 ТБ и 16 ТБ из приведенной выше таблицы срока службы, у которых показатель AFR за весь срок службы составляет менее 1 %, а доверительный интервал — 0,5 % или менее. Это жесткие диски, которые до этого момента демонстрировали стабильную надежность в нашей среде.
Данные статистики жесткого диска
Полный набор данных, использованных для создания информации в этом обзоре, доступен на нашей странице данных тестирования жесткого диска. Вы можете скачать и использовать эти данные бесплатно в своих целях. Все, что мы просим, это три вещи: 1) вы указываете Backblaze в качестве источника, если вы используете данные, 2) вы соглашаетесь с тем, что вы несете единоличную ответственность за то, как вы используете данные, и 3) вы никому не продаете эти данные; это свободно.
Если вам нужны таблицы и диаграммы, используемые в этом отчете, вы можете загрузить файл .zip из облачного хранилища Backblaze B2, который содержит файлы .jpg и/или .xlsx, если применимо.