По состоянию на 30 июня 2020 года в нашей экосистеме облачного хранилища Backblaze было 142630 вращающихся жестких дисков, распределенных по четырем центрам обработки данных. Из этого числа имелось 2271 загрузочный диск и 140 059 дисков с данными. В этом обзоре рассматривается частота отказов жестких дисков во втором квартале 2020 года и в течение всего срока службы моделей дисков с данными, которые в настоящее время используются в наших центрах обработки данных, и содержится ряд аналитических данных и наблюдений на этом пути. Как всегда, ждем ваших комментариев.
Квартальная статистика отказов жестких дисков за второй квартал 2020 г.
В конце второго квартала 2020 года Backblaze использовала 140 059 жестких дисков для хранения данных клиентов. Для нашей оценки мы исключаем из рассмотрения те модели накопителей, для которых у нас не было как минимум 60 накопителей (почему — см. Ниже). В нашем обзоре осталось 139 867 жестких дисков. В таблице ниже показано, что произошло во втором квартале 2020 года.
Примечания и наблюдения
Годовая частота отказов (AFR) во втором квартале 2020 года составила 0,81% по сравнению с первым кварталом 2020 года, который составлял 1,07%. Показатель AFR за 2 квартал — это самый низкий показатель AFR за любой квартал с тех пор, как мы начали отслеживать его в 2013 году. Кроме того, это первый раз, когда квартальный AFR оказался ниже 1%. Год назад (второй квартал 2019 года) квартальная AFR составляла 1,8%.
В течение этого квартала у трех моделей накопителей было 0 (ноль) отказов накопителей: Toshiba 4 ТБ (модель: MD04ABA400V), Seagate 6 ТБ (модель: ST6000DX000) и HGST 8 ТБ (модель: HUH728080ALE600). В то время как диски Toshiba емкостью 4 ТБ зафиксировали менее 10 000 дисковых дней, у нас не было сбоев дисков для этой модели с четвертого квартала 2018 года, или 54054 дисковых дня. При сравнении дисковых дней с диском Toshiba, диски Seagate 6 ТБ и HGST 8 ТБ выглядят столь же впечатляюще: в этом квартале не было сбоев, но во втором квартале 2020 года было зафиксировано 80 626 и 91 000 дисковых дней соответственно.
192 диска (140 059 минус 139 867) не были включены в приведенный выше список, потому что у нас не было как минимум 60 дисков данной модели. Например, у нас есть: 20 жестких дисков Toshiba 16 ТБ (модель: MG08ACA16TA), которые мы проходим через процесс сертификации. С другой стороны, у нас все еще есть 25 накопителей HGST емкостью 4 ТБ (модель: HDS5C4040ALE630), что позволяет использовать модули хранения. Внимательные читатели могут заметить номер модели этих дисководов HGST и понять, что они были последними из дисков, произведенных с номерами моделей Hitachi.
Напомним, когда мы публикуем квартальную, ежегодную статистику или статистику срока службы дисков, модели с менее чем 60 дисками не включаются в расчеты или графики. Мы используем как минимум 60 дисков, так как во всех недавно развернутых модулях хранилища 60 дисков. Примечание. Диск Seagate 16 ТБ (модель: ST16000NM001G) показывает 59 дисков и указан в отчете, поскольку один отказавший диск не был заменен на момент сбора данных для этого отчета.
Тем не менее, все данные со всех моделей дисков, включая загрузочные, включены в файлы, к которым можно получить доступ и загрузить на нашей веб-странице с данными тестирования жестких дисков.
Что мы развернули во втором квартале
Мы развернули 12063 новых диска и удалили 1960 дисков путем замены и миграции во втором квартале, в результате чего мы получили 10 103 дополнительных диска. Ниже представлена таблица с развернутыми нами моделями накопителей.
Квартальные тенденции по производителям
Квартальные данные — это всего лишь данные за этот квартал. В начале каждого квартала мы стираем все предыдущие данные и начинаем собирать новую информацию. В конце квартала мы объединяем эти данные в единицу (коллекция, сумка, файл, что угодно) и называем ее; Например, второй квартал 2020 года. Это тот тип данных, на который вы смотрели, когда просматривали квартальный график за второй квартал 2020 года, показанный ранее в этом отчете. Мы также можем сравнивать результаты за данный квартал с результатами других кварталов, каждый из которых имеет свой уникальный набор данных. Этот тип сравнения может выявить тенденции, которые помогут нам определить то, что требует дальнейшего внимания.
На диаграмме ниже показана AFR по производителям с использованием квартальных данных за последние три года. За диаграммой следуют две таблицы. Первый — это данные, используемые для создания диаграммы. Второй — это подсчет количества жестких дисков, соответствующих каждому кварталу каждого производителя.
Ноты
1. Данные для каждого производителя включают все модели приводов в эксплуатации, которые использовались для хранения данных клиентов. Не было ни загрузочных дисков, ни тестовых дисков.
2. Значения 0,00% для дисков Toshiba с третьего квартала 2017 года по третий квартал 2018 года верны. За этот период отказов дисков Toshiba не было. Обратите внимание, что за тот же период одновременно эксплуатировалось не более 231 диска. Несмотря на то, что отсутствие отказов в течение пяти кварталов примечательно, количество дисков недостаточно велико, чтобы делать какие-либо выводы.
3. Значения «н / д» для дисков WDC со второго квартала 2019 года показывают, что в течение этого периода в нашей системе не использовалось ни одного диска WDC для данных клиентов. Это не относится к новым моделям приводов HGST под торговой маркой WDC, поскольку в настоящее время мы не используем ни одну из этих моделей.
Наблюдения
1. WDC: данные WDC демонстрируют, как слишком мало точек данных (т. Е. Жестких дисков) может привести к большим расхождениям между квартальными сравнениями.
2. Toshiba: как и данные WDC, количество жестких дисков Toshiba в течение большей части периода слишком мало, чтобы делать какие-либо достойные выводы, но начиная с четвертого квартала 2019 года это меняется, и с тех пор данные становятся более надежными.
3. Seagate: после неуклонного роста AFR последние два квартала были благоприятными для Seagate, причем последний квартал (AFR = 0,90%) стал лучшим из всех, что мы когда-либо видели у Seagate с тех пор, как мы начали вести статистику еще в 2013 году. Хорошие новости, заслуживающие более пристального внимания в ближайшие месяцы.
4. HGST: с AFR, колеблющимся от 0,36% до 0,61%, диски HGST выигрывают за предсказуемость. Скучно, да, но довольно скучно.
Совокупные тенденции по производителям
В отличие от квартальных данных, кумулятивные данные начинают собирать данные в заданной точке, и новые данные добавляются, пока вы не прекратите сбор. В то время как квартальные данные отражают события, произошедшие в течение определенного квартала, совокупные данные — это все, что касается нашей коллекции жестких дисков с течением времени. Используя кумулятивные данные, мы можем увидеть долгосрочные тенденции за период, как показано на диаграмме ниже и в следующей таблице данных.
Вниз и вправо
Для всех производителей вы можете увидеть тенденцию к снижению AFR с течением времени. Хотя это положительный момент, мы все же хотим понять, почему, и включить эти знания в наше общее понимание нашей среды — точно так же, как отказ диска, важно и его «безотказность». В процессе рассмотрения этих выводов, если у вас есть какие-либо мысли по этому поводу, дайте нам знать в комментариях. Может быть, вы думаете, что жесткие диски становятся лучше, или более вероятно, что мы добавили так много новых дисков за последние три года, что они доминируют в статистике, или это что-то еще? Дайте нам знать.
Частота отказов жестких дисков за весь срок службы
В таблице ниже показан срок службы AFR для моделей жестких дисков, которые были у нас в эксплуатации по состоянию на 30 июня 2020 г. Отчетный период с апреля 2013 г. по 30 июня 2020 г. Все перечисленные диски были установлены в течение этого периода.
Примечания и наблюдения
AFR за весь срок службы составил 1,64%, это самый низкий показатель с тех пор, как мы начали отслеживать в 2013 году. Кроме того, AFR за время существования упал с 1,86% во втором квартале 2018 года до текущего значения, даже несмотря на то, что мы прошли такие этапы, как эксабайт хранилища под управлением., открытие центра обработки данных в Амстердаме и увеличение размера компании почти вдвое. Два года напряженных.
Все диски Seagate 12 ТБ (модель: ST12000NM001G) были установлены во втором квартале, поэтому, хотя у нас есть разумный объем данных, как группа, эти диски все еще находятся на ранней стадии своего жизненного цикла. Хотя не все модели с возрастом следуют изгибу ванны, нам следует подождать еще пару кварталов, чтобы увидеть, как они работают в нашей среде.
Диски Seagate на 4 ТБ (модель: ST4000DM000) продолжают валяться. Их средний возраст составляет почти пять лет, поэтому гарантийный срок у них давно истек (один или два года в зависимости от того, когда они были приобретены). Говоря о возрасте, модель диска с самым высоким средним возрастом в таблице — это диск Seagate 6 ТБ с возрастом более 64 месяцев. У этой же модели во втором квартале 2020 года не было отказов, поэтому они, похоже, устаревают.
Данные статистики жесткого диска
Полный набор данных, использованных для создания информации, использованной в этом обзоре, доступен на нашей веб-странице с данными тестирования жесткого диска. Вы можете бесплатно скачать и использовать эти данные в своих целях. Все, что мы просим, - это три вещи: 1) вы указываете Backblaze в качестве источника, если используете данные, 2) вы соглашаетесь с тем, что несете исключительную ответственность за то, как вы используете данные, и 3) вы никому не продаете эти данные — они это бесплатно.
Если вам просто нужны сводные данные, используемые для создания таблиц и диаграмм в этом сообщении в блоге, вы можете скачать ZIP-файл, содержащий электронную таблицу MS Excel.
f001.backblazeb2.com/file/Backblaze_Blog/Q2_2020_Drive_Stats_Chart_Data.zip
Удачи и дайте нам знать, если найдете что-нибудь интересное.