Как узнать, сколько времени проработает ваш твердотельный накопитель SSD. Увеличение срока службы SSD диска Ресурс жесткого диска ssd

Покупка SSD-накопителя - хорошее вложение денег. Но вы ведь не хотите, чтобы ваш SSD однажды умер, не так ли? Так что интересно увеличить срок службы ssd-накопителя и посмотреть, стоит ли игра свеч.

Как обезопасить SSD от вредного влияния и не убить диск за две недели?

Я только что получил свой первый SSD. И у меня работает мониторинг SSDLife в фоновом режиме. После этого я установил все программное обеспечение и протестировал SSD. Программа SSDLife сказала, что "Total Data written, GB” = 52.1 (40GB используемого пространства, 70GB - свободного).

То есть, на SSD около 40 Гб данных, при этом записано 52,1 ГБ?

Особенность твердотельного накопителя - данные записываются в блоках. Блок может содержать 256Кб: 256 * 1000 * 8 двоичных разрядов. Для изменения хотя бы одной из этих цифр, вы должны переписать весь блок. То есть, ваша операционная система видит 1 бит, но износ SSD эквивалентен 256Кб: разница в 2,048 млн раза.

Это означает, что формула (РАЗМЕР SSD) * (циклы) = общая данные, записанные на SSD до выхода из строя

это только для лучшем случае, который позволил бы вам писать данные от 1000 до 1000000 раз до отказа. Но, даже в худшем случае, это более вероятно для всех небольших циклов записи на SSD. Это подтверждается в

Какова продолжительность жизни SSD-диска?

SSD - накопители более надежны, чем жесткие диски, и должны служить до 20 лет, по крайней мере, не беря во внимание ухудшение производительности.

И это то, что мы могли бы назвать усредненным показателем. Вы можете придумать срок жизни SSD в худших случаях, если хотите. Но я могу вас заверить, что они выглядят не слишком оптимистично!

Давайте же максимизируем срок службы нашего драгоценного SSD путем выравнивания износа и сводя к минимуму все эти маленькие циклы записи, используя простые и передовые технологии...

Убедитесь, что функция TRIM включена

Во-первых, нет смысла проверять и пытаться включить TRIM, если ваш ssd диск не поддерживает эту технологию. Как узнать, поддерживает ли ваш SSD-диск функцию TRIM? Самый простой способ - получить эту информацию через программку CrystalDiskInfo .

В поле Supported Features можно видеть, поддерживает ли SSD TRIM:

Следующий шаг - проверить, знакома ли ваша операционная система с функцией TRIM. В ОС Windows 7 вы можете разузнать это с помощью команды fsutil behavior query disabledeletenotify . Если результат равен нулю, операционная система использует TRIM.

В случае, если система не признает ваш диск как SSD, вы должны обнаружить и устранить неисправности. Руководствуйтесь информацией, содержащейся в диспетчере устройств и свойствах SSD. Возможно, вам нужно обновить драйверы вашего дискового контроллера для того, чтобы операционная система воспринимала накопитель как SSD.

Отключите или переместите ненужные функции ОС

Наша операционная система выполняет функции, которые производят запись на диск, когда память не может использоваться по какой-то причине, наряду с трюками, которые ускоряют ваш компьютер, если у вас есть жесткий диск, но больше не нужны на SSD.

Давайте рассмотрим наиболее важные особенности, которые могут вызвать проблемы и посмотрим, можно ли отключить их.

Отключаем файл подкачки SSD

Файл подкачки (своп) необходим для улучшения быстродействия операционной системы в ресурсоемких приложениях (графические пакеты, редакторы видео, игры). Кроме того, если запущено много «тяжелых» программ и оперативная память не справляется с объемом данных, незадействованные приложения временно хранятся в свопе.

Оптимальный размер файла подкачки примерно равен 3/2 размера ОЗУ. Если у вас более 8 Гб ОЗУ, на SSD файл подкачки не нужен. Попробуйте отключить его и протестировать компьютер некоторое время. Вряд ли вы заметите какие-либо проблемы с производительностью.

Узнать объем оперативной памяти компьютера и отключить его на SSD можно в окне «Свойств системы» (Win+Pause Break).

  1. Откройте диалог «Быстродействие» (Мой компьютер ->Свойства системы ->Параметры быстродействия (см. предыдущую тему)).
  2. Во вкладке «Дополнительно» нажмите кнопку «Изменить».
  3. В окне виртуальная память напротив названия системного диска показан размер файла подкачки. Выбираем SSD-диск - устанавливаем опцию "Без файла подкачки" - кнопка «Задать» для применения изменений.

Спящий режим (гибернация)

Еще одна особенность, которая может вызвать проблемы - спящий режим компьютера (гибернация). Если вам действительно не нужна эта функция, рассмотрите возможность сна или выключение, потому что при гибернации ОС пишет свою память в файл гибернации, причем каждый раз, когда компьютер входит в спящий режим. Если вы решите не использовать спящий режим, отключить его можно командой

powercfg /hibernate off

выполнив ее от имени администратора. Это позволит отключить опцию спящего режима и удалить файл гибернации. Переместить файл спящего режима невозможно.

Службы SuperFetch и Defrag

Производители советуют выключить обе функции, так как ваш SSD не нуждается в дефрагментации вообще, он и без того достаточно быстр. Это делает SuperFetch бесполезной службой.

  1. Отключите службу SuperFetch
  2. Убедитесь, что дефрагментатор отсутствует в заданиях планировщика, отключите или удалите программное обеспечение для дефрагментации. Тем не менее, желательно оставить эту функцию для HDD.

Индексирование поиска

Большинство людей считают, что индексатор поиска необходим, так как он значительно ускоряет поиск данных на жестком диске.

Если у вас в наличии только SSD, можете спокойно отключить Индексатор поиска. Если у вас есть SSD и HDD, вы должны переместить кэш индексатора поиска на ваш жесткий диск. Это позволит избежать множества записей на диск всякий раз, когда файл сохраняется в кэше поиска.

Другой способ разобраться с индексатором - сократить места индексации до минимума, если вы точно знаете, что искать там ничего не будете.

Временные файлы, кэш и журналы

На вашем компьютере хранится гигантское количество временных файлов, кэш и журналы. Это приводит к большому количеству избыточных записей на SSD! Это зависит от того, какой браузер и другое программное обеспечение вы используете.

Например Google Earth хранит кэш образов мест, которые вы посетили, поэтому всякий раз, когда вы используете Google Earth, производится запись изображений на SSD. Давайте посмотрим в следующих главах, как найти "виновников" и в дальнейшем использовать точки соединения, когда мы не можем переместить или отключить их.

Монитор ресурсов Windows

Давайте взглянем на встроенный монитор ресурсов в новых версиях Windows:

  1. Введите "Monitor" Resource в стартовом меню и запустите его (или команда resmon.exe через Пуск - Выполнить).
  2. Перейдите во вкладку "Диск".
  3. Отсортируйте Столбик "Процессы с дисковой активностью" на "Запись (байт/с)". Это позволит вам оценить объем записей на диск в вашей системе.

Если вы хотите получить больше данных, понадобится утилита Process Monitor.

Утилита Process Monitor

Скачаем программку Process Monitor от Microsoft Sysinternals и настроим фильтр на записи:

  1. Скачайте Process Monitor и запустите утилиту.
  2. Нажмите на кнопку "‘Reset’ для сброса фильтра.
  3. Установите фильтр "Operation contains WRITE then Include", затем нажмите кнопку "Add".
  4. Затем нажмите кнопку "Применить", а затем нажмите кнопку "OK".
  5. Дополнительно можно отфильтровать список по вашему SSD диску.

Теперь вы будете видеть происходящие операции записи в реальном времени. Также можно выбрать отдельный элемент и узнать подробную информацию о записи. В меню "Tools" есть "File Summary", эта команда позволяет ознакомиться со всем набором записей в разных вкладках.

Не хотите перемещать папки с SSD? Используйте точки соединения!

Точки соединения сообщают системе, что, когда доступ производится к файловому пути X, вместо этого она получит доступ к пути Y. Это очень удобно, если нужно получить доступ к C:\Windows\Temp, но вместо этого система получит доступ к E:\Storage\Cache\Temp.

Для любителей командной строки существует Junction для Windows и mklink - для Windows и Linux. Документация четко описывает, какие параметры использовать для создания, вывода команд и удаления junciton-точек.

Что лучше всего скопировать на SSD?

Вы должны поместить на SSD файлы, которым действительно требуются быстрая производительность. В основном это актуально для программ и игр. Размещение видеофайлов на SSD не даст заметного ускорения по сравнению с жестким диском. Это же относится к различным документам.

Изображения, фото будут загружаться быстрее в таких программах и пакетах, как Adobe Lightroom. Музыка будут проанализирована быстрее в DJ программах вроде Traktor Studio. Впрочем, текущие размеры SSD не совсем вписываются в эти задачи, так что облом.

Тем не менее, фотографии и музыка - хороший пример данных. Если вы сохраняете их единожды и не планируете редактировать, смело перемещайте эти данные на SSD.

Заменив на своем компьютере старенький HDD новым твердотельным накопителем, мало кто пожелает возвратиться к использованию обычного винчестера. Нежелание это продиктовано главным образом неоспоримым преимуществом SSD перед HDD в скорости доступа к данным, но вместе с тем многие остаются во власти сомнений и страхов относительно долговечности твердотельных дисков. Как известно, все SDD имеют ограниченное число циклов перезаписи.

А это нередко побуждает пользователей всеми способами, подчас совершенно излишними и даже вредными, минимизировать запись на диск.

В действительности SSD -диски вовсе не так уже и недолговечны, как это может показаться на первый взгляд, и даже те из них, которые принято считать менее всего надежными, способны выдержать поистине огромные объемы записываемых данных. Впрочем, знать примерный срок жизни своего SDD не помешает. Приблизительно определить срок службы диска несложно, главное - это знать, как минимум, его TBW (максимальный объем, который можно записать) и объем данных, который уже был записан и предположительно будет записан на диск в течение энного времени. Приблизительный срок жизни SSD также можно определить, зная количество циклов перезаписи, декларируемое производителем.

Что такое SLC, MLC, TLC и TBW

Большинство имеющихся на рынке твердотельных накопителей созданы по технологии NAND , в которой в свою очередь могут использоваться три типа чипов памяти: SLC , MLC и TLC .

Самыми быстрыми и долгоживущими являются диски NAND SLC , их ресурс циклов перезаписи составляет 100 000 раз, но они невероятно дороги и редко встречаются на полках магазинов. Диски MLC гораздо более распространены. Они намного дешевле, но вместе с тем медленнее. Ресурс циклов перезаписи MLC -дисков составляет примерно 3000 раз. Самые дешевые, медленные и короткоживущие SSD -диски изготовлены по технологии NAND TLC , но даже они обладают вполне приемлемым по меркам среднестатистического пользователя ресурсом. Количество циклов перезаписи TLC -дисков составляет примерно 1000 раз.

Определить тип накопителя можно с помощью программы AIDA64 (Хранение данных -> Физические диски -> Тип флэш-памяти) , хотя и не всегда. Зная же тип, определяем навскидку продолжительность жизни диска, применив упрощенную формулу. Способ, если честно, не особо годный, так как не учитывает целый ряд показателей. Допустим, у вас есть TLC -диск объемом 120 Гб , на который в день в среднем записывается 10 Гб данных. Тысячу циклов умножаем на 120 и делим на 10 , вот так:

1000 * 120 / 10 = 12000

12000 - это количество дней, в течение которых мы будем записывать на SSD по 10 Гб ежедневно. Делим на 365 и получаем 32 года. В реальности это число на порядок меньше. Чтобы избежать регулярной перезаписи одного и того же блока, что привело бы к его быстрой смерти, при записи новых данных контроллер равномерно распределяет их по всему SSD . Фактически это означает, что на диск записывается больше данных, чем видимо кажется пользователю.

Но выравнивание износа не единственная переменная, определяющая продолжительность жизни SSD . TRIM , тип записываемых данных и еще ряд факторов также оказывают своё влияние. Поэтому подкорректируем нашу формулу, предположив, что контроллер записывает на носитель в 10 раз больше данных, что взято с большим и очень даже большим запасом.

1000 * 120 / 10 * 10 = 1200

Итого, три с небольшим года. Маловато, но не станем забывать о взятом запасе, к тому же маловероятно, что на такой маленький и «слабый» TLC -диск вы станете записывать по 10 Гб ежедневно. Сократите объем записываемой информации до 5 Гб в день и диск прослужит как минимум шесть с половиной лет, что вполне нормально для среднего винчестера. С чипами памяти SLC , MLC и TLC всё более или менее понятно, но хотелось бы больше конкретики. Нужен TBW диска, который, к сожалению, указывают далеко не все производители SSD . Большинство ограничиваются наработкой на отказ (в часах) , но много ли от того толку?

Так где же искать этот самый TBW?

Если он не указан на самом диске или прилагаемой к нему документации, идем на сайт производителя и пробуем отыскать его в технических характеристиках модели. Разберем всё на примере диска KINGSTON SUV400S37240G объемом 240 Гб . Переходим на сайт www.kingston.com , идем по ссылкам SSD -> .

И выбираем диск с нашей серией - UV400 . Откуда мы ее взяли, надеемся, понятно. KINGSTON это название производителя, следующая за ним буква S в строке SUV400S37240G это обозначение серии, а UV400 – ее номер.

Кликаем по ней и внимательно изучаем содержимое окна.

Как можно видеть, диск KINGSTON SUV400S37240G имеет тип NAND TLC и TBW 100 Тб , что нам, собственно, и нужно.

Теперь узнаем, сколько данных уже было записано на диск. Если ваш накопитель поддерживает новый протокол NVM Express , объем записанных данных покажет (см. поле «Всего хост-записей») .

У нас оно оказалось пустое…

Поэтому мы воспользовались другой утилитой - SSD-Z . Нужные данные указаны в поле «Bytes Written» .

В данном примере это 76,22 Гб , TBW же диска составляет 100 Тб , а это значит, что на него еще можно записать еще 99923,78 Гб . Допустим, что мы станем записывать на диск по 5 Гб в день.

Делим 99923 на 5 и еще на 365 и получаем 54 года. Зная оставшийся ресурс и объем ежедневно записываемых данных, несложно посчитать приблизительное время жизни SSD . Есть, однако, одна проблема. Учитывает ли SSD-Z объем данных, увеличенный контроллером? Маловероятно. Поэтому полагаться лучше всего на данные S.M.A.R.T. , извлечь которые, увы, можно далеко не из всех моделей дисков. Ладно, тогда поделим 54 на заоблачные 10 и получим 5,4 года - срок службы среднего накопителя. А вообще, можно смело увеличить его в два раза.

Подводим итоги

Так каким же SSD-дискам отдавать предпочтение? Зависит от того, в каких целях вы собираетесь их использовать. Если ограничитесь веб-серфингом, офисной работой и нечастым скачиванием мультимедийного контента, то вполне хватит и TLC от 240 Гб , если для дел поважнее, ну, к примеру, частой установке виртуальных машин, редактированию больших видеофайлов, ежедневному скачиванию торрентов и прочее, то, пожалуй, стоит приобрести MLC -диск на 500 Гб , ведь чем больше объем диска, тем больше будет его TBW .

Безопасно ли хранить файлы на SSD?

Начнём с предыстории. SSD-накопители вышли на сцену в тот момент, когда компания Intel представила новую архитектуру процессоров Nehalem и одновременно объявила о том, что "узким местом" в новых ПК отныне являются не процессоры, а жёсткие диски, производительность которых, в самом деле, практически не прогрессировала. На форуме для разработчиков (IDF, Intel Developer Forum) 2008 года в Сан-Франциско компания Intel показала первые твердотельные диски и указало на те причины, вследствие которых обычные жёсткие диски снижают производительность системы с новым процессором Core i7. Три года спустя многочисленные тесты серийных SSD подтвердили, что твердотельные накопители действительно раскрывают потенциал новых процессоров, существенно повышая производительность системы.

Но производительность - далеко не единственный показатель для устройства хранения данных. Когда дело доходит до ваших данных, даже самый быстрый накопитель в мире ничего не стоит, если вы не можете быть уверены в том, что он может надёжно хранить информацию.

Данная тема ещё более актуальна сейчас, в связи с массовым переходом к техпроцессу 25 нм. Более тонкий техпроцесс предполагает снижение стоимости производства NAND-памяти, поэтому тенденция закономерна, и даже на 25 нм ячейках процесс не остановится.

За последние два года Intel дважды переходила на более тонкий техпроцесс NAND-памяти для SSD-накопителей: с 34 нм на 25 нм и с 25 нм на 20 нм

Вместе с тем, инженерам всё труднее преодолевать проблемы с памятью, произведённой по технологии 25 нм. Но нынешние покупатели всё ещё могут рассчитывать на лучшую производительность и надёжность новых твердотельных накопителей, по сравнению с предыдущим поколением. Снижение количества циклов перезаписи ячеек, обусловленное переходом на более тонкий техпроцесс, приходится как-то компенсировать.

Тип SSD Гарантированное число циклов перезаписи Общее количество записанных Тбайт (по формуле JEDEC) Ресурс накопителя (10 Гбайт/день, WA = 1,75)
25 нм, 80 Гбайт 3000 68,5 Тбайт 18,7 лет
25 нм, 160 Гбайт 3000 137,1 Тбайт 37,5 лет
34 нм, 80 Гбайт 5000 114,2 Тбайт 31,3 лет
34 нм, 160 Гбайт 5000 228,5 Тбайт 62,6 лет

Таким образом, не нужно переживать по поводу количества циклов перезаписи, которые способен выдержать ваш SSD. Для предыдущего поколения твердотельных накопителей, где применялась NAND-память, изготовленная по 34-нм техпроцессу, гарантированное число циклов перезаписи составляло 5000. Иными словами, вы можете записывать и стирать ячейку NAND 5000 раз до тех пор, пока она не начнёт терять способность сохранять данные. Исходя из того, что среднестатистический пользователь пишет, максимум, 10 Гбайт в день, потребуется примерно 31 год, чтобы диск пришёл в негодность.

Для нового поколения SSD с 25-нм памятью продолжительность жизни диска составляет около 18 лет. Конечно, здесь мы очень упрощаем реальное положение вещей. Такие специфические для SSD проблемы, как усиление записи (write amplification), сжатие данных и сборка мусора могут влиять на реальный результат. Тем не менее, понятно, что нет веских причин сразу после покупки SSD-диска начинать отсчитывать часы до того момента, когда ему придёт конец.

С другой стороны, мы точно знаем, что некоторые SSD-накопители уже пришли в негодность. В этом легко убедиться, изучив данный вопрос на форумах или в отзывах интернет-магазинов. Но проблема в данном случае заключается не в исчерпании ресурса ячеек. Как правило, к выходу диска из строя приводит ошибка прошивки. Нам известны случаи, когда производители настоятельно рекомендуют подвергнуть новый диск перепрошивке, что способствует повышению надёжности, а иногда и заметному улучшению производительности накопителя.

Ещё одна причина выхода из строя SSD связана с электронной начинкой. Конденсатор или чип памяти могут прийти в негодность, что приводит к поломке диска. Конечно, мы ожидаем меньшего количества подобных проблем, по сравнению с обычными HDD, имеющими движущиеся детали, которые неизбежно выходят из строя по истечении определённого времени.

Но правда ли, что отсутствие движущихся деталей делает твердотельный накопитель надёжнее диска на магнитных пластинах? Этот вопрос волнует всё большее число компьютерных энтузиастов и IT-специалистов. Именно он заставил нас проанализировать реальную надёжность SSD, чтобы отделить факты от беллетристики.

Что мы знаем о накопителях?

SSD - относительно новая технология (во всяком случае, по сравнению с жёсткими дисками, возраст которых приближается к 60 годам). Таким образом, нам предстоит сравнить новый тип накопителей с технологией, проверенной временем.

Но что мы реально знаем о надёжности обычных жёстких дисков? На этот вопрос проливают свет два важных академических исследования.

В 2007 году компания Google обнародовала исследование надёжности 100 000 дисков потребительского уровня с интерфейсом PATA и SATA, применявшихся в дата-центрах Google.

Примерно в то же время доктор Бианка Шредер (Bianca Schroeder) совместно с экспертом доктором Гартом Гибсоном (Garth Gibson) провели расчёт частоты замены более 100 000 накопителей, которые применялись в одной из крупнейших национальных лабораторий США.

Разница между этими двумя исследованиями лишь в том, что во втором случае в исследовании участвовали накопители с интерфейсом SCSI и Fibre Channel, а не только PATA и SATA.

Тем, кто хочет более детально ознакомиться с результатами академических изысканий, мы советуем прочитать хотя бы второй - в 2007 году этот аналитический отчет был признан лучшим на конференции File and Storage Technologies (FAST ’07) в США. Если чтение подобных источников не входит в ваши планы, мы приводим здесь ключевые моменты, непосредственно затрагивающие интересующий нас вопрос.

Средняя наработка до отказа (MTTF)

Если речь идёт об измерении надёжности накопителя, можно вспомнить о таких двух показателях, как средняя наработка на отказ (MTBF - Mean Time Between Failures), под которой понимается среднее время между отказами, а также средняя наработка до отказа (MTTF - Mean Time To Failure), ключевым отличием которой является допущение, что после отказа система не может быть восстановлена.

Вот что пишет на этот счет Википедия:

В английском языке используется термин MTBF (Mean Time Between Failures) - среднее время между отказами или наработка на отказ, а также MTTF (Mean Time To Failure) - средняя наработка до отказа. Следует заметить, однако, что публикуемые величины MTBF/MTTF часто основываются на результатах ускоренных испытаний - в течение ограниченного времени, позволяющего выявить преимущественно долю производственного брака. В таком случае, заявленное значение MTBF говорит не столько собственно о надёжности, и тем более не о долговечности, сколько о проценте забракованных изделий. Например, MTBF порядка 1 млн/ч для жёсткого диска, очевидно, не означает 114 лет непрерывной безотказной работы - и не только потому, что эксперимент такой продолжительности не мог быть проведён, но и потому, что сам производитель назначает ресурс (срок службы) не более 5-10 лет и гарантийный срок 1-5 лет.

Рассмотрим в качестве примера накопитель Seagate Barracuda 7200.7, который имеет заявленный показатель наработки на отказ 600 000 часов.

В любой крупной выборке накопителей половина этих дисков выйдет из строя в первые 600 000 часов работы. Так как статистика отказов HDD в крупной выборке распределена относительно равномерно, следует ожидать, например, что каждый час будет выходить из строя один диск. При таком значении MTBF можно расчитать частоту отказов за год (Annualized Failure Rate, AFR), которая составит 1,44%.

Но исследования Google и доктора Бианки Шредер выявили совсем иные показатели. Дело в том, что число вышедших из строя накопителей не всегда соответствует количеству дисков, которые подлежали замене. Вот почему Шредер измеряла не рейтинг отказов (AFR), а интенсивность замены накопителей (Annualized Replacement Rate - ARR). Рейтинг ARR основывается на реальном количестве накопителей, заменённых согласно данным сервисных журналов:

В то время, как значение AFR по даташитам варьируются от 0,58% до 0,88%, наблюдаемые показатели замены дисков ARR составляют от 0,5% до 13,5%. Таким образом, наблюдаемый показатель ARR, в зависимости от конфигурации накопителей и их типа, может быть до 15 раз выше, чем значения AFR в соответствии с даташитами.

Производители жёстких дисков определяют число отказов иначе, чем это делаем мы, а потому не удивляет, что данные, которые они приводят, не соответствуют реальной надёжности накопителей. Обычно рейтинг MTBF определяется на основе ускоренного тестирования, информации о возврате винчестеров или с помощью тестирования отобранных дисков. Данные о возврате накопителей - весьма сомнительная информация. Как утверждает Google, "мы сталкивались... с ситуациями, когда тест накопителей давал "зелёный свет" дискам, которые неизбежно отказывали на практике".

Статистика отказов HDD по времени

Большинство пользователей считает, что график кривой отказа HDD имеет форму ванной. Вначале мы ожидаем, что многие диски выходят из строя вследствие так называемой "детской болезни", то есть различного рода заводских недоработок и непосредственно процесса "обкатки". Затем, по завершении начального периода, процент отказа дисков должен быть минимален. Наконец, в конце предполагаемого срока службы, кривая отказа HDD неотвратимо ползёт вверх, так как детали накопителя имеют определённый ресурс. Подобный ход мысли, который представляется вполне логичным, отражён на следующем графике.

Но этот график не соотвествует реальному положению вещей. Исследования Google и доктора Бианки Шредер показали, что отказы HDD с течением времени стабильно увеличиваются.

Надёжность дисков Enterprise-класса

При сравнении двух исследований можно представить, что показатель 1 000 000 MTBF для диска Cheetah намного ближе к заявленным в даташите MTBF 300 000 часов. Это означает, что накопители "потребительского" и Enterprise-класса имеют примерно одинаковый процент ежегодного выхода из строя, особенно когда сравниваются диски примерно равного объёма. Как утверждает директор по техническому планированию компании NetApp Вал Берцовичи (Val Bercovici), "... то, как дисковые массивы справляются с соответствующими отказами жёстких дисков, продолжает создавать в восприятии потребителя точку зрения, что более дорогие диски должны быть более надёжными. Одна из грязных тайн данной индустрии заключается в том, что большинство дисков Enterprise-класса состоит из тех же компонентов, что и накопители потребительского класса. Тем не менее, их внешние интерфейсы (FC, SCSI, SAS и SATA) и, что более важно, специфические особенности firmware, оказывает наибольшее влияние на поведение дисков потребительского и Enterprise-класса в реальных условиях" .

Безопасность данных и RAID

Исследование Шредер охватывает диски Enterprise-класса, задействованные в больших RAID-массивах одной из крупнейших лабораторий по высокопроизводительным вычислениям. Как правило, мы ждём, что хранение данных в RAID-конфигурациях обеспечивает более высокий уровень безопасности, но отчёт Шредер обнаружил нечто удивительное.

Распределение времени между заменами диска показывает снижение частоты отказов, что означает, что ожидаемый промежуток времени до очередной замены диска постепенно увеличивается с тех пор, как был заменён предыдущий диск.

Таким образом, отказ одного накопителя в массиве повышает вероятность отказа другого накопителя. Чем больше времени прошло с последней замены диска, тем больше времени пройдёт до замены другого. Конечно, это имеет последствия с точки зрения реконструкции RAID-массива. После первого отказа в четыре раза возрастает вероятность того, что вы столкнётесь с очередным выходом диска из строя в течение того же часа. В пределах 10 часов вероятность отказа диска увеличивается только в два раза.

Температура


Ещё один неожиданный вывод можно сделать из отчёта Google. Исследователи брали показатели температуры SMART (Self-Monitoring, Analysis and Reporting Technology) – технологии, которую поддерживает большинство жёстких дисков. И обнаружили, что более высокая температура накопителя никак не коррелирует с более высокой частотой отказов. Судя по всему, температура оказывает воздействие на надёжность старых накопителей, но и в этом случае эффект не столь значителен.

Технология SMART - действительно умна?

SMART по-английски означает "умный", но действительно ли данная технология контроля состояния винчестера справляется со своей функцией? Если ответить кратко, то нет. Технология SMART создавалась для того, чтобы сообщать об ошибках диска достаточно рано для того, чтобы вы могли осуществить резервное копирование данных. Однако, согласно отчёту Google, более трети вышедших из строя накопителей не включили режим тревоги SMART.

Данный факт особо не удивляет, так как многие специалисты годами подозревали нечто подобное. В действительности, технология SMART оптимизирована на обнаружение механических неполадок, в то время как основную часть функциональности жёсткого диска обеспечивает электронная начинка. Вот почему некорректная работа HDD и неожиданные проблемы, вроде внезапного отключения питания, остаются незаметными для SMART до тех пор, пока не возникают ошибки, связанные с целостностью данных. Если вы рассчитываете на то, что SMART сообщит вам о грядущем выходе диска из строя, всё равно необходимо обеспечить дополнительный уровень защиты, если вы хотите быть уверены в сохранности данных.

Теперь посмотрим, как в противостоянии с жёсткими дисками ведут себя SSD-накопители.

Кратко о надёжности SSD

К сожалению, ни один из производителей жёстких дисков не публикует данные о возврате, но это же относится и к производителям SSD. Тем не менее, в декабре 2010 сайт Hardware.fr представил отчёт по частоте отказов HDD, полученный от родительской компании LDLC, являющийся одним из лидеров компьютерного ритейла во Франции. На сайте имелся следующий комментарий относительно того, как они рассчитывали данный показатель:

Частота возврата охватывает накопители, проданные между 1 октября 2009 и 1 апреля 2010, возвраты которых состоялись до октября 2010, то есть период эксплуатации составлял от 6 месяцев до года. Статистика по производителям основана на минимальной выборке от 500 экземпляров, а по моделям - на минимальной выборке от 100 экземпляров.

Как можно понять, речь идёт не об интенсивности отказов, а о количестве возвратов. Возможно, языковой барьер ответственен за то, как интерпретировали данный факт англоязычные IT-издания. Такие сайты, как Mac Observer и ZDNet недостаточно корректно обозначили эти данные как "частоту отказов", вероятно, основываясь на автоматическом переводе Google.

Модели дисков Статистика возвратов
Hitachi Deskstar 7K1000.B 5,76%
Hitachi Deskstar 7K1000.C 5,20%
Seagate Barracuda 7200.11 3,68%
Samsung SpinPoint F1 3,37%
Seagate Barracuda 7200.12 2,51%
WD Caviar Green WD10EARS 2,37%
Seagate Barracuda LP 2,10%
Samsung SpinPoint F3 1,57%
WD Caviar Green WD10EADS 1,55%
WD Caviar Black WD1001FALS 1,35%
Maxtor DiamondMax 23 1,24%
WD Caviar Black WD2001FASS 9,71%
Hitachi Deskstar 7K2000 6,87%
WD Caviar Green WD20EARS 4,83%
Seagate Barracuda LP 4,35%
Samsung EcoGreen F3 4,17%
WD Caviar Green WD20EADS 2,90%
SSD-диски
Intel 0,59%
Corsair 2,17%
Crucial 2,25%
Kingston 2,39%
OCZ 2,93%

Жёсткие диски объёмом 1 Тбайт
Модели дисков Статистика возвратов
Samsung SpinPoint F1 5,20%
WD Caviar Green (WD10EADS) 4,80%
Hitachi Deskstar 7K1000.C 4,40%
Seagate Barracuda LP 4,10%
WD Caviar RE3 WD1002FBYS 2,90%
Seagate Barracuda 7200.12 2,20%
WD Caviar Black WD1002FAEX 1,50%
Samsung SpinPoint F3 1,40%
WD Caviar Black WD1001FALS 1,30%
WD Caviar Blue WD10EALS 1,30%
WD Caviar Green WD10EARS 1,20%
Жёсткие диски объёмом 2 Тбайт
Hitachi Deskstar 7K2000 5,70%
WD Caviar Green WD20EADS 3,70%
Seagate Barracuda LP 3,70%
WD Caviar Black WD2001FALS 3,00%
WD Caviar Green WD20EARS 2,60%
WD Caviar RE4-GP WD2002FYPS 1,60%
Samsung EcoGreen F3 1,40%
SSD-диски
Intel 0,30%
Kingston 1,20%
Crucial 1,90%
Corsair 2,70%
OCZ 3,50%

Отказ диска подразумевает, что устройство больше не функционирует. Но возврат может предполагать множество причин. Это создаёт определённую проблему, ведь у нас нет никакой дополнительной информации по причинам возврата дисков: они могли быть мертвы ещё при поступлении в магазин, сломаться в течении срока эксплуатации или всего лишь имела место некая несовместимость с железом, помешавшая покупателю использовать накопитель.

Продажи между 10.1.2009 и 4.1.2010, возвраты до 10.1.2010
Top-3 лидеров возврата SSD Статистика возвратов Top-3 лидеров возврата HDD Статистика возвратов
OCZ Vertex 2 90 Гбайт 2,80% 8,62%
OCZ Agility 2 120 Гбайт 2,66% Samsung SpinPoint F1 1 Tбайт 4,48%
OCZ Agility 2 90 Гбайт 1,83% Hitachi Deskstar 7K2000 3,41%
Продажи между 4.1.2010 и 10.1.2010, возвраты до 4.1.2011
OCZ Agility 2 120 Гбайт 6,70% Seagate Barracuda 7200.11 160 Гбайт 16,00%
OCZ Agility 2 60 Гбайт 3,70% Hitachi Deskstar 7K2000 2 Tбайт 4,20%
OCZ Agility 2 40 Гбайт 3,60% WD Caviar Black WD2001FASS 4,00%

Эта информация лишь преумножает количество вопросов. Если основная часть продаж осуществлялась через интернет-магазин, то существенное влияние на статистику отказов могла оказать плохая упаковка или повреждения в ходе доставки. Более того, мы также не имеем никакой возможности выяснить, как покупатели использовали эти диски. Существенный разброс в частоте отказов лишь подчёркивает данную проблему. Например, число возвратов для Seagate Barracuda LP увеличилось с 2,1% до 4,1%, в то время как для Western Digital Caviar Green WD10EARS она упала с 2,4% до 1,2%.

Так или иначе, эти данные действительно ничего не говорят нам о надёжности. Но для чего, в таком случае, они вообще нужны? Вывод заключается лишь в том, что во Франции большинство покупателей были более чем удовлетворены покупкой Intel SSD и не возвращали их, в отличие от накопителей других брендов. Удовлетворение потребителя – тема интересная, но она намного менее интересна, чем реальная частота отказов. Так что продолжим наш анализ.

Отзывы дата-центров

Стоимость за гигабайт продолжает оставаться барьером, мешающим даже крупным организациям использовать тысячи SSD одновременно. Но даже с учётом того, что мы не имеем доступа к полноценным массивам твердотельных накопителей, не означает, что мы не можем осветить вопрос надёжности SSD в реальных условиях, основываясь на опыте небольших организаций. Мы решили связаться с нашими знакомыми, работающими в сфере IT, и получили довольно интересные отзывы нескольких дата-центров.

NoSupportLinuxHosting.com: меньше 100 SSD


Зеркалирование загрузочного раздела на основе двух SSD-дисков Intel X25-V

Хостинг "No Support Linux" не приводит точное число установленных накопителей, но компания сообщает, что использует "немалое количество" SSD. Мы знаем, что они применяют менее сотни твердотельных дисков, которые задействованы следующим образом:

  • Intel X25-V объёмом 40 Гбайт используются как зеркалируемые загрузочные диски для тонких серверов и серверов хранения данных ZFS;
  • Intel X25-M объёмом 160 Гбайт используются в качестве кэша L2ARC в серверах ZFS;
  • Intel X25-E объёмом 32 Гбайт используются как зеркалируемые ZIL-тома в серверах ZFS.

Все эти диски используются не менее одного года, а некоторым из них недавно исполнилось два года. С учётом сказанного необходимо отметить, что компания не сталкивалась ни с одним фактом выхода из строя SSD-накопителя.

Когда мы спросили, какие преимущества даёт применение твердотельных дисков в серверах, мы получили следующий ответ:

В сочетании с ZFS и гибридными системами хранения, применение SSD-накопителей позволяет получить существенный прирост производительности, по сравнению с традиционными дисками на магнитных пластинах. Мы по-прежнему используем жёсткие диски в качестве основного хранилища, так что мы можем сохранить их преимущество в цене, одновременно извлекая преимущество от SSD по скорости. Рано или поздно, мы планируем полностью перевести наши сервера SAN на SSD-накопители. Но в течение 2011 году мы будем придерживаться гибридной системы хранения, используя ZFS.

InterServer.net

InterServer использует твердотельные диски лишь на серверах баз данных. В частности, на серверах с процессором Xeon используются накопители Intel X25-E (SSDSA2SH032G1GN), что позволяет извлечь максимальный результат от высокой пропускной способности накопителя. О каких значениях производительности здесь идёт речь? InterServer говорит нам о достижении 4514 запросов в секунду для сервера MySQL. На старом сервере Xeon, оснащённом IDE-винчестерами, количество запросов MySQL в секунду составляет 200-300. Нам известно, что твердотельные диски применяются в InterServer с 2009 года и с тех пор не было ни одного выхода диска из строя.

Итак, компания InterServer сообщила нам следующую информацию в контексте использования SSD:

Intel SSD - день и ночь в отношении надёжности, когда речь заходит о сравнении с некоторыми другими накопителями. Например, диски SuperTalent SSD имеют весьма высокий показатель отказов, включая модели FTM32GL25H, FTM32G225H и FTM32GX25H. По нашим оценкам, около двух третей этих дисков вышли из строя с начала эксплуатации. Причём, после выхода из строя информацию с этих дисков практически нельзя было восстановить. То есть накопитель просто исчезал из системы и его больше невозможно было прочитать. Жёсткие диски "умирают" более благородно и в большинстве случаев информацию с них легко восстановить. Но мы не можем сравнить их с Intel SSD, так как до сих пор ещё не сталкивались с выходом из строя последних.

Steadfast Networks: более 100 SSD

Steadfast Networks применяет около 150 SSD Intel, что делает данную компанию несколько более крупным пользователем SSD, чем две предыдущие. Применяются модели линейки X25-E (32 Гбайт и 64 Гбайт) и X25-M (80 Гбайт и 160 Гбайт). В меньшем количестве представлены накопители Intel X25-V40 объёмом Гбайт, а также установленные клиентами компании твердотельные диски других марок, такие как OCZ Vertex 2, SuperTalent и MTron Pro. Независимо от марки, все эти SSD применяются только в серверах баз данных либо в качестве кэша.


Steadfast Networks - почти 150 SSD в работе

За два года использования твердотельных накопителей Steadfast Networks лишь дважды имела опыт отказа дисков, потребовавших их замены, причём оба случая привели к необходимости восстановления данных с SSD. Возможность восстановления данных с вышедшего из строя твердотельного диска зависит от взаимодействия между контроллером и firmware. Сценарий, описанный представителем InterServer относительно дисков SuperTalent, является худшим из возможных - данные вообще не удалось восстановить. Но этот случай не является общим правилом для SSD.

Имея большую выборку, мы, наконец, нашли случаи отказов SSD. Но по сравнению с накопителями на магнитных пластинах их процент по-прежнему достаточно низок. Тем не менее, президент компании Steadfast Networks Карл Циммерман (Karl Zimmerman) считает, что это всё же занижает преимущества SSD и поясняет это следующим образом:

Просто мы получаем заметно более высокую производительность операций ввода/вывода [при использовании SSD] по меньшей цене, чем могли бы получить то же самое, используя обычные жёсткие диски. У нас много клиентов, которым нужна большая производительность I/O, чем могут дать четыре SAS-диска со скоростью вращения шпинделя 15 000 об/мин в конфигурации RAID 10, не говоря уже о том, что сам по себе подобный апгрейд требует перехода на сервера с большим шасси, поддерживающим более четырёх дисков, оснащённые крупной платой RAID и т. д. Другим конфигурациям необходимо больше 16 дисков со скоростью шпинделя 15 000 об/мин, чтобы обеспечить требуемый уровень производительности операций I/O. Переход на один SSD (или пары штук в RAID-конфигурации) значительно упрощает конфигурацию сервера и, в целом, делает её ощутимо дешевле. Достаточно сказать лишь о том, что обычно достаточно одного SSD, чтобы заменить не меньше четырёх жёстких дисков, причём показатель AFR для четырёх HDD составляет около 20%, в то время как для одного SSD он равен 1,6%.

Softlayer: около 5000 SSD!


Softlayer: свыше 1000 SSD!

Люди из Softlayer - наши давние друзья, а ещё они создали крупнейшую в мире хостинг-компанию. Так что, о хранении данных они знают немало. Используя около 5000 SSD-накопителей, они предоставили нам впечатляющий объём данных для анализа. Вот отчёт, предоставленный компанией Softlayer.

Накопитель Число дисков в компании Рейтинг AFR Текущий срок жизни диска
Intel 64 GB X25-E (SLC) 3586 2,19% 2
Intel 32 GB X25-E (SLC) 1340 1,28% 2
Intel 160 GB X25-M (MLC) 11 0% менее 1
HDD-накопители 117 989 см. отчет Шредер

Опыт Softlayer в отношении частоты отказов дисков SAS и SATA соотвествует отчёту Google, о которым мы говорили в начале данной статьи. Проще говоря, частота выхода из строя жёстких дисков прямо пропорциональна возрасту накопителя и на практике результаты очень близки к тому, что доказали исследования Google и Шрёдер. В первом году жизни процент отказов накопителей (AFR) составляет 0,5-1% и постепенно возрастает до 5-7% к пятому году жизни.

Частота выхода из строя жёстких дисков не удивляет, но показатель выхода из строя твердотельных накопителей оказался достаточно близок к результатам AFR по HDD. Конечно, SSD-диски эксплуатируются пока всего два года и нужно подождать, пока пройдёт 3-4 года с начала эксплуатации, чтобы узнать, сохранится или нет в отношении к SSD-дискам тенденция увеличения частоты отказов, характерная для магнитных накопителей.

Softlayer использует почти полностью SSD-накопители на основе SLC-памяти, чтобы избежать проблем с износом ячеек при многократных операциях перезаписи. Если основываться на сценариях использования компанией накопителей, то мы знаем, что ни один из дисков не вышел из строя по причине износа ячеек. Но многие из отказавших SSD вышли из строя без соответствующего предупреждения SMART. Это именно то, о чём мы уже неоднократно слышали от сотрудников дата-центров. Как отмечали специалисты компании InterServer, жёсткие диски имеют склонность выходить из строя более "благородно". SSD зачастую "умирают" внезапно, независимо от причины поломки, что отмечают многие конечные пользователи по всему миру. Опыт Softlayer более разнообразный, по сравнению с InterServer: некоторые накопители удалось восстановить, а другие - нет. Ни один из 11 накопителей Intel серии X25-M в Softlayer не вышел из строя, но дисков этой линейки слишком мало, чтобы на основе этого делать какие-либо выводы, да и эксплуатируются они менее года.

Так ли важна надёжность накопителя?

Несмотря на то, что твердотельные диски на SLC-памяти занимают всего лишь часть рынка SSD, мы получили намного больше информации по данному типу накопителей, чем по моделям, в которых используется более дешёвая память типа MLC. Даже с учётом того, что выборка накопителей в нашем обзоре составляет 1/20 от количества жёстких дисков в предыдущих обзорах, имеющаяся информация позволяет считать, что твердотельные диски на SLC-памяти нельзя назвать более надёжными, чем жёсткие диски с интерфейсом SAS и SATA.

Если вы потребитель, данный факт позволяет сделать важные выводы. Производители SSD пытаются акцентировать внимание на двух основных преимуществах данной технологии: лучшей производительности и надёжности. Однако, если хранить данные на SSD не более безопасно, чем на обычном жёстком диске, то производительность становится единственной реальной причиной для приобретения твердотельного диска.

Мы не утверждаем здесь, что производительность SSD не важна (или не впечатляет). Тем не менее, сама по себе технология SSD в данный момент имеет узкую специфику. Если бы вы собрались противопоставить твердотельные накопители против жёстких дисков по скоростным характеристикам, то обнаружили бы интересный факт: по производительности SSD-накопитель бюджетного класса превосходит HDD примерно на 85%. Твердотельный диск класса Hi-End обеспечивает преимущество над жёстким диском на 88%, что также не слишком впечатляет.

Эта достаточно тонкая разница объясняет, почему такие компании, как Intel, акцентируют внимание именно на надёжности твердотельных накопителей. На недавней презентации новой линейки SSD 320 компания Intel вновь попыталась обыграть этот мотив, используя информацию по возвратам дисков с сайта Hardware.fr в качестве доказательства надёжности своих изделий. Несомненно, именно отличная репутация SSD-накопителей Intel является ответом на вопрос, почему у нас так много информации по твердотельным дискам данной марки. Но данные Hardware.fr, которые приводит Intel, похоже, не соотвествуют реальному положению вещей.

Производительность SSD-накопителей будет лишь расти, в то время как наиболее продвинутые производители будут снижать стоимость таких дисков. Вместе с тем, это означает, что производителям придётся искать иные способы дифференцировать свои изделия.

До тех пор, пока в новых SSD - даже hi-end класса - продолжают выявляться явные баги с прошивками и прочие недоработки, потребители, заинтересованные, в первую очередь, в надёжности хранения данных, будут рассматривать технологию SSD как недостаточно зрелую. Поэтому мы полагаем, что на сегодняшний день именно надёжность должна стать основной мишенью эволюции SSD.

Intel дал потребителям серьёзный запас уверенности, несколько месяцев назад подняв срок фирменной гарантии для новой линейки SSD 320 с трёх до пяти лет. Конкурирующие модели SSD mainstream-класса, основанные на контроллерах SandForse первого и второго поколения, а также контроллере Marvell с интерфейсом SATA 6 Гбит/с, продолжают продаваться с трёхлетней гарантией. Накопители Enterprise-класса также, в основном, поставляются с пятилетней гарантией. Понятно, что это стимулирует вендоров продавать системы, оснащённые более надёжными накопителями, чтобы снизить расходы на гарантийное обслуживание в течение трёх или пяти лет. Но, конечно, трудно закрыть глаза на "детские болезни" технологии SSD, вроде необходимости обновления прошивки, которые, по большому счёту, затрагивают и производительность твердотельных накопителей.

Пояснения к вопросу о надёжности

Жёсткие диски и накопители на основе NAND-памяти иногда выходят из строя и это связано с различными факторами, обусловленными их уникальной архитектурой и конструкцией. Когда мы говорим о надёжности жёстких дисков, на ум приходит тот факт, что они основаны на механических деталях, часть из которых во время работы диска находится в движении. И хотя конструктивно жёсткие диски соответствуют очень строгим допускам, тем не менее, каждая деталь имеет определённый срок службы.

Мы также знаем, что SSD-накопители лишены подобных проблем. Их "твердотельная" природа в принципе исключает риск повреждения считывающей головки или выхода из строя шпинделя.

Но хранение данных на SSD неотъемлемо связано с виртуализацией, так как здесь нельзя физически разметить статическое LBA-пространство, как на жёстком диске. Поэтому возникают другие факторы, определяющие надёжность накопителя. Прошивка - это самый существенный из них, мы видим воздействие данного фактора всякий раз, когда слышим о неполадках в работе SSD.

За последние три года все баги в SSD-накопителях Intel всегда решались обновлением прошивки. Проблемы Crucial с управлением энергосбережением модели m4 были решены выходом новой прошивки. И мы видели, что самый известный партнёр SandForce, - компания OCZ - ответила на многочисленные жалобы потребителей выходом сразу нескольких прошивок. Фактически, случай SandForce наиболее показателен. Поскольку производители SSD-дисков могут использовать различные прошивки в качестве средства дифференциации моделей, диски на основе контроллеров SandForce от разных производителей, очевидно, могут иметь различные баги, свойственные конкретной прошивке. Данный факт, несомненно, только усложняет задачу повышения надёжности твердотельных накопителей.

Если оставить специфику SSD в стороне, то теперь нам необходимо определить надёжность дисков различных производителей. Проблема здесь заключается в том, что способы, при помощи которых каждый вендор, реселлер или потребитель измеряет данный показатель, несколько различается, что делает объективное сравнение практически невозможным.

В частности, мы были очень впечатлены презентацией SSD-накопителей Intel на IDF 2011, где акцентировалось внимание на надёжности. Но в дискуссии с компанией ZT Systems, данные которой приводила Intel, мы выяснили, что в приводимом рейтинге AFR 0,26% не учитывается количество накопителей и речь идёт лишь об "подтверждённых" ошибках. На самом деле, если вы - IT-менеджер, то для вас важна и частота "незарегистрированных" ошибок. Речь идёт о ситуациях, когда вы отсылаете дефектное изделие продавцу, а он отвечает, что с диском всё в порядке. Это не означает, что диск свободен от неполадок, так как причина могла заключаться в конкретной конфигурации либо иных прикладных факторах. На самом деле, существует немало реальных примеров такого рода.

"Незарегистрированные" ошибки, как правило, случаются в 2-3 раза чаще, чем "утверждённые". На самом деле, компания ZT System приводит другие данные по частоте "неутверждённых" ошибок - 0,43% для 155 000 накопителей Intel X25-M. Но мы снова сталкиваемся с тем фактом, что эти данные не отсортированы по сроку службы накопителей, так как диски рассматриваются в группах. Согласно техническому директору ZT System Кейси Черетани (Casey Cerretani), конечная величина в данный момент лишь рассчитывается, но примерно мы можем говорить о показателе AFR 0,7% в первый год эксплуатации. Конечно, этот показатель по-прежнему ничего не значит с точки зрения надёжности в долгосрочной перспективе, что является одной из главных проблем при оценке надёжности твердотельных накопителей в сравнении с HDD.

Основной вывод состоит в том, что теперь мы знаем, какое влияние различные методы оценки надёжности накопителей оказывают на конечный результат. Более того, лишь время покажет, насколько надёжность SSD-накопителей превосходит соответствующий показатель для HDD. Зато теперь вы точно знаете, что сейчас какой-либо однозначный вывод сделать невозможно, так как очень много исходных данных вызывают сомнения.

В качестве заключения

Наш отчёт по дата-центрам охватывает только частоту выхода из строя SSD Intel, так как накопители именно этого производителя в настоящий момент пользуются наибольшим доверием у крупных предприятий. Учитывая проблемы с определением надёжности SSD, мы преднамеренно не ставим задачу найти самого надёжного производителя, но сотрудники отдела маркетинга Intel, судя по всему, не зря получают свою зарплату.

В исследовании Google отмечается следующее: "Известно, что частота отказов в значительной мере зависит от модели, производителя и возраста диска. Наши данные не противоречат этому факту. Но большинство отмечаемых со временем сбоев связаны именно с возрастом диска".

Опыт, о котором мы узнали от дата-центров, применим ко всем SSD. Один из директоров предприятий сообщил нам, что считает цену OCZ Vertex 2 замечательной, но их надёжность - ужасной. В конце прошлого года его компания запускала некую новую систему, по случаю чего было закуплено около 200 накопителей Vertex 2, 20 из которых не работали по прибытию. И это не первый человек, который рассказывает нечто подобное.

Что на практике это значит для SSD?

Давайте взглянем на всё изложенное здесь в некой рациональной перспективе. Вот что мы узнали о надёжности жёстких дисков из исследований Google и Шрёдер:

  1. MTBF ничего не говорит о надёжности;
  2. Ежегодная частота отказов (AFR) выше, чем заявляет производитель;
  3. Диски не имеют тенденцию выходить из строя в первый год эксплуатации. Частота отказов постепенно увеличивается с возрастом диска;
  4. SMART не является надёжной системой, определяющей скорый выход диска из строя;
  5. Частота отказов "потребительских" дисков и накопителей "enterprise"-класса очень близка;
  6. Отказ одного диска в массиве увеличивает риск подобного поведения других дисков;
  7. Температура почти не оказывает влияния на надёжность накопителя.

Благодаря Softlayer с их парком SSD в 5000 штук, мы знаем, что первые четыре утверждения также применимы к SSD. Как мы видели в обоих исследованиях HDD, существенно влияние на их надёжность оказывает контроллер, прошивка и интерфейс (SAS против SATA). Для SSD-дисков основными факторами также являются контроллер и прошивка, причём их роль даже выше. Если правда, что износ ячеек из-за многократных операций перезаписи не играет никакой роли в статистике отказов SSD-накопителей и качество применяемой в "потребительских" дисках MCL-памяти сравнимо с SLC, напрашивается вывод, что твердотельные диски Enterprise-класса, в целом, не надёжнее "потребительских".

Меньше дисков - выше надёжность

Конечно, для систем хранения данных корпоративного класса важна не только надёжность, но и производительность. Чтобы достичь высокой производительности операций ввода/вывода, IT-специалистам приходится создавать RAID-массивы на основе жёстких дисков со скоростью шпинделя 15 000 об/мин. Нередко апгрейд для увеличения количества операций I/O приводит к покупке нового сервера, оснащённого более мощной RAID-платой и позволяющего установить больше накопителей. Учитывая превосходные характеристики I/O для твердотельных дисков, в случае их использования можно было бы ограничиться намного более скромной конфигурацией сервера, не говоря об экономии энергии и снижении температуры.

Здесь есть ещё один интересный момент.

Частота выхода из строя отдельных дисков для большого массива будет выше: по данным исследования Шредер, после отказа одного диска в массиве возрастает вероятность выхода из строя других дисков. Кроме того, существенно выше будет вероятность отказа одного из дисков в массиве, так как здесь начинает играть роль математический фактор.

В данном случае мы не поднимаем тему сохранности данных, что зависит от уровня RAID и других факторов. Понятно, что с точки зрения сохранности данных один SSD не заменит два зеркалируемых HDD, несмотря на то, что вероятность выхода из строя для него будет ниже, чем для одного из дисков в системе. Однако, если речь идёт о крупной RAID-системе, то достаточно очевидно, что надёжнее иметь конфигурацию на четырёх SSD-дисках, чем сравнимую по скорости систему на 16 HDD.

Сам факт использования SSD не снимает необходимости избыточности данных для RAID либо резервного копирования. Но вместо того, чтобы создавать громоздкие RAID-конфигурации на HDD, можно ограничиться значительно более простым решением на основе твердотельных дисков. Как пишет Робин Харрис на сайте StorageMojo: "Забудьте RAID, просто копируйте данные три раза" .

Избыточность хранения данных на SSD не приводит к высокой стоимости. Если вы работаете в среднем и крупном бизнесе, вам нужно лишь скопировать информацию с производительного SSD-диска на HDD, который служит для резервного копирования.

Идея получить более высокую производительность, потратив меньше денег, не нова. SSD-диски в самом деле позволяют получить чрезвычайно высокое количество операций ввода/вывода, высокую надёжность и обеспечить избыточность хранения данных - причём цена такого решения будет ниже, чем в случае громоздкой RAID-конфигурации. Вместе с тем, массив на HDD может превосходить свой аналог на SSD в плане объёма дискового пространства. На сегодняшний день, цена за гигабайт для твердотельных дисков всё ещё слишком высока и к вопросу размещения данных на SSD следует подойти с умом, ведь хранить на них все данные вряд ли получится.

О том же для десктопов

Всё вышесказанное относится к серверам. Возложим ответственность за принятие решения о переходе или не переходе на SSD на сотрудников дата-центров.

Если же разговор заходит о десктопных системах, то мы не имеем оснований предполагать, что SSD надёжнее жёстких дисков. Так или иначе, недавние события с отзывами SSD-дисков и багами в прошивках достаточно ярко показали, что ограниченное число циклов перезаписи ячеек NAND на данный момент является далеко не основным недостатком технологии.

В конце концов, любой накопитель представляет собой электронное устройство, независимо от того, есть ли там движущихся детали или нет. И тот факт, что твердотельные диски не имеют таких деталей, в полной мере не говорит об их надёжности.

Мы задали вопрос специалистам из CMRR (Center for Magnetic Recording Research) - научного центра, располагающего исчерпывающей информацией о системах хранения данных на магнитных носителях.

Доктор Гордон Хьюз (Gordon Hughes), один из основных разработчиков технологий SMART и Secure Erase, отмечает, что и HDD, и SSD в своей эволюции расширяют границы соответствующих технологий. И когда это происходит, не ставится цели создать самые надёжные накопители в мире.

Как отмечает доктор Стив Свансон (Steve Swanson), исследующий NAND-память: "Не похоже на то, чтобы производители делали свои диски столь надёжными, как они могут делать. Они делают диски настолько надёжными, насколько это целесообразно с точки зрения финансовых затрат" . Рынок определяет стоимость компонентов накопителя и она не может быть выше определённой величины.

Так, например, производители NAND-памяти продолжают выпуск 50-нм чипов, обладающих более высоким ресурсом циклов перезаписи, чем 34-нм и 25-нм чипы. Но стоимость $7-8 за гигабайт не позволит использовать такие модули в накопителях, ориентированных на массовый рынок.

Возможно, самое большое раздражение вызывает тот факт, что каждый вендор продаёт жёсткие диски и SSD, не представляя объективных данных об их надёжности, хотя все они определенно знают об истинном положении вещей, продавая миллионы устройств в год (по данным IDC, в 2009 году продано 11 миллионов SSD) и фиксируя каждый возврат.

Несомненно, частота поломок зависит от многих факторов, часть из которых находится вне компетенции производителя (качество доставки, специфика эксплуатации накопителя). Но при благоприятном стечении обстоятельств HDD достигают 3% AFR на пятый год эксплуатации, что вполне сравнимо с аналогичным показателем для SSD. Не удивительно, что специалисты из CMRR говорят о том, что на сегодня SSD не обеспечивают более высокую надёжность, по сравнению с жёсткими дисками.

Надёжность накопителей - чувствительная тема и мы потратили немало времени, общаясь с вендорами и ритейлерами, стремясь провести собственное исследование SSD, предназначенных для массового рынка. И единственный вывод, который можно сделать прямо сейчас, заключается в том, что к любой информации от производителя SSD необходимо относиться с определённой долей скептицизма.

Стоит отметить, что SSD Intel на сегодняшний день пользуются максимальным доверием у потребителей и информация от дета-центров неизменно основывается на SLC-накопителях этой марки как "золотом стандарте" для SSD. Но согласно доктору Хьюзу, нет никаких оснований полагать, что продукты Intel более надёжны, чем лучшие модели HDD. У нас нет возможности исследовать интенсивность отказов SSD, находящихся в эксплуатации более двух лет, поэтому вполне возможно, что эта статистика изменится в ту или иную сторону.

Стоит ли сейчас воздерживаться от покупки SSD? Если вы защищаете свои данные регулярно делая резервные копии файлов, то нет никаких причин избегать использования твердотельных накопителей. Например, мы применяем SSD на всех наших тестовых платформах и в большинстве рабочих станций.

Цель данного обзора состояла в том, чтобы определиться, действительно ли SSD так надёжны, что о резервном копировании хранимой на них информации можно забыть как о пережитке прошлого. Теперь мы знаем ответ на этот вопрос.

Надёжность жёстких дисков хорошо изучена в массивных исследованиях и это не удивительно, так как этот тип накопителей используется уже очень давно. Со временем мы, несомненно, узнаем значительно больше о надёжности SSD.

Установка твердотельных накопителей используется гораздо реже, чем использование дисков HDD. Пользователей отпугивает низкий срок службы SSD.

Ускорить работу компьютера или ноутбука можно разными способами. Одно из проблемных мест — скорость работы жесткого диска HDD. Заменив жесткий диск твердотельным накопителем SSD, можно увеличить эту скорость, а значит, и работу всей системы.

Есть ли какие-то подводные камни у такой замены? Или установка SSD — способ, позволяющий решить проблему скорости раз и навсегда? Нужно знать, что у твердотельных накопителей существуют свои минусы. Основной параметр, уменьшающий долговечность SSD, это количество циклов перезаписи. По этому параметру твердотельные накопители проигрывают жестким дискам. Теоретически SSD живет меньше HDD. Рассмотрим, каким образом увеличить количество циклов перезаписи и как продлить жизнь SSD.

Сердце HDD — вращающиеся пластины, как правило, из металла или керамики. Запись происходит на тонкий внешний металлический слой этих пластин. Головка HDD движется над поверхностью пластин и намагничивает или размагничивает определенные секторы. Таким образом, процесс записи — это процесс намагничивания/размагничивания.

Для процесса записи данных неважно, была ранее записана на нем информация или нет. Диску все равно: запись проходит одинаково в любом случае.

Особенность записи данных для твердотельного накопителя

В SSD-диске вместо вращающихся пластин применяются микросхемы памяти. Твердотельный накопитель — это фактически большая флешка.

По сравнению с HDD запись (и перезапись) данных на диски SSD имеет ряд особенностей.

Для процесса записи имеет значение, есть на данный момент информация на диске или нет. Когда в ячейке памяти имеются ранее записанные данные, сначала происходит их удаление, а только потом запись новых. То есть процесс записи проходит в 2 этапа: сначала удаление старых данных, а потом внесение новых.

Срок жизни SSD на сто процентов определяется количеством циклов перезаписи, то есть зависит от того, сколько раз можно записать и удалить информацию с диска. Количество циклов перезаписи имеет свой предел. Каждый цикл сокращает , и, если превысить некую границу, ячейка умирает. Что-либо записать на нее становится невозможно. Однако накопитель сможет прожить дольше. Продление времени жизни диска возможно только за счет увеличения количества циклов.

Ячейки памяти объединены в блоки. Тонкость в том, что запись данных можно проводить в каждой ячейке по отдельности, а удалять можно только блок целиком. И, если надо изменить только одну ячейку из блока, приходится совершать несколько дополнительных действий: перенести все данные в другое место, стереть блок и только потом вернуть на место блок и измененную ячейку. В результате происходит увеличение циклов перезаписи на каждое изменение информации в SSD. Это еще больше сокращает ресурс SSD-устройства. Такое явление получило название Write Amplification. Минус его в том, что перезаписывает несколько раз одну и ту же информацию.

Поэтому стоит задача как увеличить срок службы SSD, так и сохранить преимущество в скорости. Поскольку надежность накопителя определяется количеством циклов перезаписи, возникает задача оценки продолжительности жизни SSD-диска. Для этого указывается такой параметр, как TBW (Total Bytes Written). Он показывает, какой максимальный объем информации можно гарантированно записать на диск. Оценивать TBW принято в терабайтах (Тб). Так, значение 150 TBW указывает, что на диск можно гарантированно записать 150 терабайт информации. Превышение этого значения надежную работу накопителя не гарантирует.

У дисков разных производителей это значение отличается. Например, у SSD Kingston HyperX 120 Gb этот параметр составляет 354 TBW. У SSD OCZ Trion 100 240 Gb — 60 TBW. Диск Crucial MX 100 — 72 TBW.

Переводя абстрактные для обычного пользователя числа в понятные значения, можно привести такой пример. Возьмем TBW, равный 75. Это не самое большое значение, у многих производителей TBW существенно больше. Для того, чтобы накопитель гарантированно проработал 3 года, нужно каждый день записывать на него примерно 64 Гб информации. Величина для обычного пользователя практически нереальная. Мало кто записывает такой объем данных каждый день. А твердотельный накопитель Kingston HyperX с TBW, равным 354, в идеальных условиях, при ежедневной записи 2 Гб данных может прожить 100 лет! Только вдумайтесь, 100 лет службы хватит детям, внукам и даже правнукам.

Тесты показывают, что просмотр изображений или документов не влияет на запись данных. Это чтение данных. Только изменение документов или копирование файлов влечет за собой процесс записи на диск.

Что может предпринять пользователь

Эксплуатация SSD-устройства имеет свои особенности. Есть много способов, которые могут повысить надежность твердотельных накопителей. Опишем лишь некоторые из них. Дело в том, что в операционной системе есть некоторые функции, способные увеличивать скорость работы жесткого диска. Парадоксально, но увеличивая скорость HDD, они одновременно снижают надежность работы ССД. Что это за функции, снижающие долговечность SSD-диска?

Гибернация. При гибернации оперативная память компьютера сбрасывается на накопитель. После возобновления работы системы, данные опять переписываются в оперативную память для точного восстановления состояния компьютера. Это позволяет быстрее запускать систему и увеличивает скорость работы. Процесс, абсолютно безвредный для HDD, может сильно влиять на время жизни SSD. Дело в том, что при гибернации перезаписываются гигабайты информации. Если у компьютера 6 Гб оперативной памяти, то при гибернации может случится так, что этот объем придется весь записать, а потом удалить с диска. Чтобы SSD-устройство могло проработать долго, гибернацию лучше вообще не использовать.

Дефрагментация. Цель дефрагментации — уменьшить количество перемещений головки жесткого диска, тем самым повышая скорость доступа к информации. У SSD нет движущихся частей и дефрагментация, как способ увеличения скорости работы, ему не нужна. Более того, она вредна, так как дефрагментация — это фактически перезапись информации с одного места накопителя на другое, что увеличивает количество циклов записи и удаления. Для увеличения срока службы устройства отключите эту функцию.

Оптимизация дисков. Надежный способ повысить скорость работы HDD. Эта технология предварительно загружает из накопителя часто используемые данные в оперативную память. В процессе оптимизации кэш записывается на диск и регулярно обновляется. При установке HDD использование технологии оправдано. В случае SSD это только увеличивает количество циклов перезаписи. Данная технология может как продлить срок службы SSD, так и немного сэкономить место на диске.

Обращать внимание на эти функции стоит, если вы активно используете компьютер и в полной мере нагружаете SSD-накопитель. Большинству пользователей, даже если они оставят все настройки по умолчанию, не стоит беспокоиться о времени жизни твердотельного накопителя. Продолжительность жизни SSD будет такой же, как и у HDD. Для требовательных пользователей существует специальная программа, которая осуществляет тестирование SSD-дисков и дает полную информацию о состоянии накопителя.

Компьютерное издание The Tech Report в августе прошлого года начало тестирование SSD-накопителей . Цель - проверить, сколько циклов перезаписи выдержит каждый из шести экземпляров. Эксперимент продолжается до сих пор: после записи 1 петабайта в живых остались три накопителя .



Для тестирования выбрали программу Storage Utilities от Anvil

Производительность выживших накопителей сильно не снизилась. В общем, эти модели не так интересны, как патогенез скончавшихся «пациентов». Все они незадолго до кончины начали работать чуть медленнее, но сломались по разным причинам.

Накопители Intel 335 Series 240GB и Kingston HyperX 3K 240GB выдали многочисленные предупреждения о неминуемом выходе из строя, хотя в самом конце полностью перестали реагировать на внешние раздражители.

А вот Samsung 840 240GB, в котором используется более хрупкая флеш-память TLC NAND, погиб без предупреждения, если не считать сбоев. Он в течение срока эксплуатации страдал из-за отказов отдельных ячеек памяти и многочисленных неисправимых ошибок. На него удалось записать 900 ТБ, при этом 119 из 295 неисправимых ошибок пришлось на период между 800 и 900 ТБ, а почти все остальные - в районе 300 ТБ, то есть после проведения теста на сохранение данных без питания в течение нескольких дней.

Все три погибших SSD завершили работу в состоянии, когда с них невозможно было восстановить данные. В частности, накопитель Intel перешёл в режим read-only, а после выключения и включения питания активировал что-то вроде процедуры самоуничтожения и полностью вышел из строя (возможно, это было связано с попыткой записи на диск, находящийся в режиме read-only). Он всё ещё определялся драйвером, но только как 0GB SATA device.

Хотя шесть экземпляров - явно недостаточная статистическая выборка, но все они на сотни терабайт превысили заявленный в характеристикам срок эксплуатации. В частности, на каждый удалось записать более 700 ТБ. Это доказывает очень высокую надёжность современных SSD потребительского сегмента. Тем более восхищают показатели накопителей, которые продолжают работать и после петабайта: это Corsair Neutron GTX 240GB, Samsung 840 Pro 256GB и второй экземпляр Kingston HyperX 3K 240GB (со сжатием данных).

Из-за встроенной компрессии данных Kingston HyperX 3K зарегистрировал всего 716 ТБ записанных данных, хотя на него отправили петабайт. Сбоев пока нет: только два перемещённых сектора.

Corsair Neutron GTX, если верить встроенной утилите Toolbox и показателю «SSD life left», вообще чувствует себя как новенький.

Издание The Tech Report обещает довести до смерти оставшиеся три накопителя и рассказать, как они умерли.

Кстати, компания Google несколько лет назад по выходу из строя HDD в своих дата-центрах. Из неё следует, что возникновение сбоев не связано с количеством записанной на диск информации, зато положительно коррелирует с количеством запусков-остановок диска и негативно коррелирует с температурой: чем холоднее, тем чаще происходят сбои.