0

Жесткий диск под микроскопом

Валерий Косихин

30 января 2013

Жесткий диск — один из самых удивительных компонентов современного компьютера. Только представьте себе, что мы все еще храним данные с помощью магнитно-механической технологии, которая существует с 50-х годов ХХ века и успела повидать ламповую электронику и грампластинки. Представьте, что мы живем в альтернативной Вселенной, где жесткий диск никогда не был изобретен и все данные записываются на Flash-память или другие твердотельные носители. Тогда что вы скажете на предложение сохранять информацию в виде намагниченных участков на вращающемся диске, где записывающая головка сможет точно позиционироваться на дорожках, расстояние между которыми сопоставимо по размеру с транзисторами, создаваемыми в интегральных схемах с помощью фотолитографии? Это невозможно, слишком сложно, ненадежно и недолговечно? Нет, это реальность, которую мы принимаем как нечто само собой разумеющееся. Пример технологии, доведенной до изначально непредсказуемого, даже абсурдного уровня.

Хотя в основе технологии HDD лежат простые принципы, для того чтобы она достигла таких высот, потребовались десятки лет разработки и научных исследований, огромное количество сложных, нетривиальных, подчас остроумных и невероятных решений, о которых немного известно за пределами круга людей, по профессии связанных с производством жестких дисков. Мы побеседовали именно с таким человеком — ему можно задать все вопросы, приходящие в голову по поводу технологий жестких дисков, которые применяются сейчас и будут внедряться в будущем. Знакомьтесь: Алекс Блеквелл (Alex Blackwell), главный инженер компании Western Digital в регионе EMEA.

Блеквелл часто общается с компьютерной прессой, но это явно не тот случай, к которому подошло бы казенное «по долгу службы часто приходится общаться». Чувствуется, что ему действительно нравится рассказывать людям о технологиях. Алекс говорит так увлеченно и ярко, что двухчасовое интервью с ним пролетело на одном дыхании. Это, в общем-то, и было мало похоже на интервью. У Алекса не пришлось ничего «выспрашивать», и на один вопрос он выдавал гораздо больше интереснейшей информации, чем мы изначально рассчитывали получить. Получилась фактически полноформатная лекция об интересных и неочевидных фактах, касающихся жестких дисков.

Составляя список вопросов, мы постарались сократить банальности из разряда «как у WD дела сейчас и каковы планы на будущее?» и узнать больше о жестких дисках в целом, не боясь в чем-то показаться наивными и невежественными. Алекс с удовольствием позволяет собеседнику быть жадным до знаний «почемучкой».

А еще у Блэквелла очень яркая речь, насыщенная метафорами и юмором. Попытаемся передать это в тексте, сделав его максимально близким к «непричесанной» стенограмме. Тем не менее, поскольку разговор постоянно крутился вокруг одних и тех же вопросов, мы именно так его и скомпонуем — в виде конспекта нескольких главных тем. Никакого единого сюжета, просто сборник увлекательных историй про жесткие диски. Вся речь идет от лица Алекса Блеквелла, вопросы и комментарии автора — курсивом.

⇡#О парковке головок и встроенном электрогенераторе

3DNews : Мы не так давно узнали, что жесткий диск использует электрический генератор, чтобы можно было завершить запись сектора в случае аварийного отключения. Можно рассказать об этом поподробнее?

Алекс Блеквелл: Когда внезапно пропадает электропитание, первое и самое важное для безопасности привода — запарковать головки. Потому что если они приземлятся на магнитный носитель, то они просто прилипнут, и больше не смогут подняться (в работе головка фактически летит над поверхностью за счет потока воздуха. — прим. автора). Это конец. Настолько гладкие у них поверхности. Представьте себе два абсолютно гладких листа стекла, прижатые друг к другу. Сколько силы нужно, чтобы разорвать их! Если вы включите привод после того как головки прилипли к диску, то вращение шпинделя просто оторвет кончик актуатора. Поэтому для парковки мы поднимаем головки и относим их на отдельную пластиковую площадку. Вернее, опускаем актуатор, а сами головки на кончике висят в воздухе.

Кончик актуатора «упал» на пластину (фото c Wikimedia Commons)

На парковку головок при обрыве питания у нас всегда есть немного свободного времени. Эта операция осуществляется с помощью электрического генератора. Но генератора как отдельного устройства в жестком диске нет. Двигатель просто используется в «реверсе», что можно сделать с любым электрическим мотором.

Так обстоят дела в течение последних 15–20 лет. Диски более старых типов парковали головки прямо на поверхность диска, у внутреннего края. Там был магнитный замок, который удерживал актуатор на месте. Если вы помните, то, выключая такой старый привод, вы слышали щелчок. Это актуатор приближался к магниту и защелкивался там. Для Western Digital производство таких дисков закончилось в 2005–2006-м, может, даже в 2007 году.

Парковать головки прямо на диске можно было потому, что изначально поверхность была не столь гладкой и головки были крупнее. Вообще, тогда все было проще. Потом поверхность потребовалось сделать очень гладкой, чтобы головка летала очень близко (сейчас зазор между головкой и поверхностью диска составляет единицы нанометров. — прим. автора). И однажды она стала слишком гладкой, чтобы можно было взлететь с нее после парковки. Тогда мы начали использовать лазер, чтобы создать текстуру на поверхности диска в парковочной зоне. Теперь, с 2007 года, парковочная зона находится вне поверхности диска, на пластиковой площадке. То есть принцип парковки головок пережил всего три этапа развития, но, несмотря на это, в данной области задействовано очень много тонких технологий.

Однако вернемся к ситуации обрыва питания. Помимо того, чтобы запарковать головки, вторая задача — спасти настолько много пользовательских данных, насколько возможно. Нужно передать на носитель фрагмент информации, который записывается в данный момент, завершить запись текущего сектора. Для этого мы просто используем остаточное вращение носителя.

⇡#Некоторые впечатляющие цифры и двухступенчатый актуатор

Первый жесткий диск появился в 1956 году. Вспомните другие технологии из 1950-х. Например, радиолампы. С тех пор у нас появились транзисторы, затем первые интегральные схемы, а затем — LSI (Large Scale Integration, микросхемы с сотнями тысяч транзисторов). Или возьмем аудиозапись. Большую часть времени мы использовали пластинки со скоростью вращения 78 об/мин. Сначала с пластиковыми иглами, потом с алмазными, потом появилась магнитная лента, CD, MP3. Некоторые технологии просто прыгнули вперед, но дисковые приводы все еще работают так же, как встарь. Есть вращающийся диск и актуатор, движущийся вдоль него, магнитная поверхность с индуктивным принципом записи и чтения. Разве что автомобили остались такими же, как в то время.

Но представьте себе первый жесткий диск от IBM. Допустим, размер одного бита на этом диске 50-х годов сопоставим со стадионом «Спартак». Насколько же тогда велик бит на современном диске? Размером с этот стол? Размером с эту комнату? Размером с мой большой палец? Правильно, именно палец! Площади, занимаемые одним битом сейчас и тогда, соотносятся в масштабе 10 8 . То есть 10 4 в каждом направлении.

IBM 350 (1956 г.) — самый первый жесткий диск. Предназначался для компьютера IBM 305 RAMAC (фото с Wikimedia Commons)

Геометрия жесткого диска постоянно сжимается. Сейчас дорожки на носителе находятся на расстоянии 50–60 нм друг от друга. А теперь вспомните микропроцессоры Intel, которые для производства по норме 28 нм используют фотолитографию, фабрики с гигантским оборудованием. А у нас в то же время есть вращающийся диск, и мы можем позиционировать головку в центре одной из дорожек, которые разделяют всего 60 нм, с точностью около 10 нм. Это настоящий хай-тек.

Вы знаете, что такое двухступенчатый актуатор (Dual Stage Actuator)? Представьте, что моя рука — это акутатор с головками на конце. Вот поворотная точка в плечевом суставе. И если вам требуется улучшить позиционирование руки, то можно обратить внимание на сустав пальца. На двухступенчатом актуаторе есть своего рода дополнительный маленький актуатор, который может перемещаться всего на несколько дорожек влево и вправо. За счет этого мы можем повысить точность позиционирования. Мы используем эту технологию уже около двух лет в корпоративных продуктах (серия RE3), а в 2012 году внедрили в некоторых потребительских моделях. В терабайтном диске серии Green, нескольких Blue, всей линейке Red, а теперь и в Black.

Схема двухступенчатого актуатора (из патента United States Patent 6624983)

⇡#WD Black и терабайтные пластины

3DNews : Расскажите, почему диски серии WD Black показывают такую впечатляющую производительность, в особенности — в тестах произвольного доступа?

Алекс Блеквелл: Одна из основ высокой производительности — скорость вращения шпинделя. Вторая основа — быстрый актуатор, за счет которого уменьшается время поиска дорожки. В дисках серии WD Black и RE в двигателе актуатора используются два больших магнита. Более сильный магнит позволяет быстрее двигать головки. В других сериях, Blue и Green, устанавливают более компактный одинарный магнит, поэтому Black опережает Blue по скорости произвольного доступа, хотя последние тоже работают на 7200 об/мин.

3DNews : А когда же появятся диски WD Black с пластинами объемом 1 Тбайт?

Алекс Блеквелл: Это вопрос приоритетов. Нет технологической причины, по которой мы не можем этого сделать. Терабайтные пластины уже применяются в «зеленой» серии при объеме 1–3 Тбайт, в «синей». Понимаете, когда ты проектируешь жесткий диск и хочешь продать его с прибылью, то нужно сочетать много параметров: производительность, объем, выход годных компонентов при производстве и множество других. Важно сочетание факторов, а не просто обладание определенной технологией. Я полагаю, что для WD Black терабайтные пластины просто еще не пришли в зону оптимального сочетания характеристик.

WD Black (слева) и WD Blue (справа) — оцените разницу в размере магнитов

⇡#Как устроены головки

3DNews: Что собой представляют головки типа GPP / GMR (Perpendicular to Plane / Giant Magnetoresistance), которые сегодня используются в жестких дисках? Как они работают?

Алекс Блеквелл: Оригинальный жесткий диск IBM и все последующие диски вплоть до 1996–1997 годов имели единые головки чтения/записи. Такая головка представляет собой разорванное кольцо с проволокой, накрученной сверху. Когда на проволоку подается ток, возникает магнитное поле, которое «вытекает» через разрыв в кольце. Если поднести разрыв к чему-то, что может быть намагничено, оно намагничивается. Что и происходит с поверхностью пластины в жестком диске: возникают участки, имеющие магнитные полюса — северный и южный. В то же время, если не подавать на головку напряжение, а просто провести вдоль намагниченного участка, в ней возникает ток.

Актуатор и его кончик под микроскопом (за фото спасибо Andrew Hazelden, www.andrewhazelden.com)

Со временем стало очевидно, что единое устройство представляет собой компромисс. Что хорошо для записи, может быть неоптимальным для чтения. Тогда нашла применение идея магниторезистивности. В качестве считывающей головки стали использовать резистор, который меняет сопротивление в присутствии магнитного поля. А в качестве записывающей головки — отдельную индуктивную часть. И больше никакого компромисса. Позже появилось второе поколение этой технологии — GMR (Giant Magnetoresistance), где Giant указывает на величину напряжения, которое позволяет развить резистивный элемент. Он просто стал более чувствительным. А на будущее после GMR у нас есть вот какая штука: TuMR — Tunneling Magnetoresistance, которая еще больше повысит эффективность головки.

Теперь о записи. Катушка с разрывом в середине, о которой я говорил изначально, используется для так называемой продольной магнитной записи. Намагниченные участки на пластине образуются в продольной ориентации. Подобно тому, как машины паркуются на улице.

Продольная и перпендикулярная запись

Но теперь мы берем и устанавливаем эти магнитики вертикально. Получается перпендикулярная запись. Не зная технологии, трудно себе представить, как это делается. На самом деле, нужно добавить к магнитной пластине еще один слой, который как бы отражает один из полюсов катушки и создает слабый магнитный эффект, распределенный по большой площади. Вот как работает перпендикулярная запись. Для машин также было бы лучше, чтобы они парковались вертикально, особенно в Москве. Главное — не забыть убрать кофе из подстаканника.

От делать нефиг решил разобрать достаточно старый жёсткий диск Maxtor (Seagate) DiamondMax 21 на 160 Gb. В своё время он отработал около полутора лет, а последние несколько месяцев свое жизни использовался в RAID 0 массиве. Однажды произошёл сбой и комп перезагрузился, в итоге рейд слетел а на жёстком диске были обноружены множественные бэд-блоки.

Возможно некоторых из вас интересует, что же из себя представляет головка жёсткого диска под микроскопом? Для увеличения использовался микроскоп с силой увеличения в 60 крат.

Ну и собственно фото головки:

Фото размеров головки:

Реальные размеры головки при измерении штангельциркулем:
Длинна – 1,2 мм
Ширина – 0,8 мм
Толщина – 0,3 мм

Выход из строя головок жесткого диска – довольно частая проблема, с которой встречаются специалисты по восстановлению данных. Причин выхода головок из строя несколько, наиболее часто встречаются:

  1. Повреждения головок при аварийном завершении работы диска (залипание на поверхности, неправильный заход на парковку и т.п.).
  2. Повреждения головок при физическом воздействии на диск (падение диска, удар по диску, сильные вибрации во время работы и т.п.).
  3. Повреждения головок при электрическом шоке (сгорел блок питания, скачок напряжения в сети электропитания, переполюсовка при подключении питания (не спрашивайте меня как, разъем каким-то образом умудряются другой стороной забить) на накопитель и т.д.).
  4. Заводской брак.
  5. Естественный износ.

В этой статье я хотел бы поговорить о последней причине. Эта причина выхода из строя блока магнитных головок жестких дисков (естественный износ) лично мне кажется наиболее интересной, так как ее довольно сложно диагностировать. Обычно для первых четырех причин все более-менее понятно практически при первом же взгляде на головки, часто – даже без микроскопа. Естественный же износ невооруженным взглядом практически не виден.

Для чего это нужно? Не проще ли, обнаружив, что головки неисправны, просто заменить их и вычитать данные? Увы, нет. От того, что именно явилось причиной выхода из строя блока магнитных головок, зависит то, как мы будем подходить к процедурам восстановления доступа к данным. Поясню на примере.

Если головки вышли из строя в результате удара, то прежде, чем устанавливать в диск исправный узел, потребуется детальное исследование магнитных пластин: не пострадали ли они в результате удара? Нет ли где царапин, сколов? Не может ли установка нового блока магнитных головок без предварительной подготовки привести к новым повреждениям? Как следствие – значительно возросший список подготовительных процедур, вплоть до нанесения на повреждения поверхностей специальных химикатов.

Другой пример. Если головки вышли из строя при неправильной аварийной парковке – то потребуется другое исследование. Потребуется оценить, каким образом повреждены головки, не погнулся ли их слайдер, не привело ли это к потере фрагментов блока внутри гермозоны, и т.п. Соответственно, и порядок работ при восстановлении информации, опять же, будет другим, вплоть до доработки парковочного элемента внутри гермозоны и значительных модификаций микропрограммы накопителя.

Ну а если головки вышли из строя в результате естественного износа, то в подавляющем большинстве случаев будет достаточно просто заменить головки и приступить к вычитыванию информации (конечно, при условии, что использованы исправные совместимые запчасти). Именно поэтому задача определения степени износа блока магнитных головок и видится мне достаточно важной.

Немного теории

Головка жесткого диска – узел, который во время работы накопителя парит над поверхностью диска, используя аэродинамические свойства своего слайдера. Для обеспечения максимальной эффективности аэродинамики поверхность MR-элемента головки выполняется идеально ровной и имеет определенный рисунок из углублений и выпуклостей.

Скорость вращения шпиндельного двигателя современного жесткого диска может варьировать от 5400 до 15000 оборотов в минуту в зависимости от назначения накопителя. Многие ноутбучные накопители делаются для увеличения энергетической эффективности низкооборотистыми; диски для серверов и высокопроизводительных платформ делаются высокооборотистыми. При такой скорости вращения внутри диска образуется мощный воздушный поток, который и используется для аэродинамики головок.

Однако у этого воздушного потока есть и другой эффект – постепенное выбивание из керамических и пластиковых частей блока магнитных головок, находящихся в непосредственном с ним соприкосновении, мелких частиц. Банальное выветривание, если говорить терминами школьного природоведения. Для того, чтобы эти частицы не повреждали поверхность (хотя, конечно, полностью этого избежать нельзя) в диске устанавливается фильтр-уловитель мелкодисперсной пыли, который находится в таком месте, где он может охватить максимальный объем проходящего воздушного потока. Борьба же с микроповреждениями поверхности, которые все-таки произошли, происходит посредством дефект-менеджмента микропрограммы жесткого диска: дефектные сектора заносятся в растущий лист дефектов и переназначаются на исправные сектора из резерва диска.

Естественный износ: как проявляется

Как правило, естественный износ блока магнитных головок начинает проявляться задолго до того, как жесткий диск окончательно выйдет из строя. Не замечают его только те, кто не следит за состоянием своего компьютерного железа в принципе. В жестком диске имеется подсистема SMART, которая накапливает статистику ошибок (переназначенные сектора, неудачные попытки старта, количество попыток переназначить сектор и т.п.), исходя из которой делается примерный прогноз выхода диска из строя. При запуске компьютера подсистема SMART опрашивается, и если все хорошо, то компьютер загружается; если же какой-то из атрибутов SMART «просел» настолько, что вышел за границы нормальности, вы увидите сообщение на втором экране POST BIOS такого типа: Hard Disk Drive XX SMART Status BAD, или похожее по смыслу. Запуск компьютера будет возможен только по нажатию одной из функциональных клавиш (обычно это F1).

К сожалению, довольно многие пользователи, имеющие проблемы с первоначальной сборкой компьютера (например, неправильный монтаж CPU FAN), которая приводит к постоянному появлению таких сообщений (что-то типа «CPU FAN speed error») и необходимости нажатия функциональной клавиши для продолжения запуска компьютера, отключают эту функцию в BIOS. В этом случае при запуске машины игнорируются все уведомления, и увидеть, было ли уведомление о плохом SMART-статусе диска при старте, становится невозможно.

Правда, операционная система Windows также распознает диски с плохим SMART-статусом, но для фактически уже умирающего диска это может оказаться слишком поздно. Да и не всегда этот механизм отрабатывает, как показывает практика: довольно часто диски с одним – двумя «просевшими» атрибутами могут не вызывать у Windows никаких подозрений весьма продолжительное время. Поэтому — смотрите накапливаемую SMART статистику, она полезна. Следить за ней можно с помощью массы бесплатных утилит, например – Victoria.

Износ диска начинается с момента начала его эксплуатации, но вначале он происходит с низкой интенсивностью. По истечении определенного времени, когда степень износа достигает определенного, критического, значения, изнашивание переходит из линейного в экспоненциальный рост, и диск переходит в неисправное состояние довольно быстро.

Основные признаки перехода диска на стадию износа по экспоненте: быстрый рост количества переназначенных секторов в отчете SMART, рост количества ошибок при попытках переназначить сектор, «подтормаживания» диска, появление «тыркающих» звуков при обращении к определенным файлам или папкам. На финальном этапе износа появляется большое количество дефектных секторов (система дефект-менеджмента уже не может справиться с потоком появляющихся дефектов), серьезные тормоза в работе диска. Выход из строя головки (или нескольких головок) по причине износа – апофеоз этого процесса. Компьютер перестает загружаться или загружается очень медленно, вы не можете скопировать никакие свои файлы, все жутко тормозит, и, наконец, просто перестает работать. Все. Головки изношены и больше не могут ничего прочитать.

Справедливости ради надо сказать, что у некоторых накопителей активирована система блокировки микропрограммы в случае ее проблем (в том числе – и дефект-менеджмента). В этом случае диск отказывается работать (либо не определяется вовсе, либо определяется, но не отдает емкость, либо определяется «заводским» именем, и т.п.). Блокировка предотвращает критический износ в случае, если диск подошел непосредственно к этой грани, при условии, что пользователь не будет пытаться «запустить» диск с помощью многократных включений («а вдруг заведется»), танцев с бубном и сомнительных рекомендаций из интернета («на полной луне положите свой диск на системный блок, плюньте три раза в вентилятор процессора и, когда прилетит обратно, произнесите ‘Информация вернись, жесткий диск загрузись’» и тому подобная антинаучная ересь). Тут только один правильный совет: нести заблокированный диск людям, которые понимают, как вытащить из него данные.

Диагностика естественного износа блока магнитных головок с помощью микроскопа

Микроскопирование головок жесткого диска уже давно стало стандартом в индустрии восстановления данных. Обследование головок под микроскопом дает возможность выявить поверхности, на которых имеются серьезные повреждения (пыль на головках, полированная поверхность головки и т.п.), выявить природу происхождения повреждений головок и т.п. Однако общепринятой методики выявления естественного износа головок нет.

С учетом того, что износ головки – это прежде всего выбивание из ее поверхности микрочастиц в результате воздействия сильного тока воздуха (микроповреждения поверхности), вполне логично, что оценить степень износа можно по состоянию ее рельефа. Однако при стандартном освещении можно увидеть только крупные изъяны рабочей поверхности MR-элемента; для того, чтобы «проявить» микрорельеф полностью, требуется два источника света: основной, направленный перпендикулярно поверхности, и некое подобие контрового света, направленного под небольшим углом (20 – 30 градусов) к поверхности. Для усиления «проявления» микрорельефа в качестве основного источника света мы использовали обычный белый свет от кольцевой галогеновой лампы, а в качестве дополнительного («контрового») света использовался светодиод холодного синего свечения.

Установка для исследования, таким образом, состоит из: тринокулярный микроскоп МС-ВП; переходник на байонет Canon EF, камера Canon EOS 5D Mark II, кольцевая лампа Model 2401, источник «контрового» света – штатный осветитель микроскопа с замененным светодиодом.


Установка для исследования степени износа блока магнитных головок жесткого диска.

При обычном освещении прямым светом на поверхности MR-элемента заметны только крупные повреждения рельефа. Это и понятно: свет идет сверху вниз под прямым углом, источник света – со всех сторон (кольцевой осветитель); при этом тени практически не отбрасываются. Введение в световую схему «контрового» источника света позволяет увидеть тени от многочисленных микронеровностей поверхности и оценить характер повреждения MR-элемента.

Пример

В качестве примера возьмем два одинаковых достаточно старых накопителя, у которых процесс износа уже идет давно, но один диск находится в критическом («предсмертном») состоянии, а второй в состоянии, когда SMART-статус только начинает предупреждать о возможном скором выходе из строя диска (диск только выходит на экспоненциальный рост износа). Диски Seagate ST3160215AS, семейство Seagate Barracuda 7200.10, емкость 160 Гбайт. В конструкции гермозоны используется 2 головки. Условия съемки одинаковые: ISO 320, выдержка 1/30, F 0 (диафрагма полностью открыта, так как съемка идет через микроскоп).

Диск в «предсмертном состоянии» имеет крайне печальные атрибуты SMART и огромное количество дефектов. Диск, SMART которого только начал показывать ошибку, имеет ровный график чтения и менее печальные показатели атрибутов SMART.


График чтения подопытного диска в критическом состоянии износа, первые 3 млн. секторов


Атрибуты SMART подопытного диска в критическом состоянии износа


График чтения подопытного диска в предкритическом состоянии износа, первые 3 млн. секторов


Атрибуты SMART подопытного диска в предкритическом состоянии износа

Посмотрим на головки сначала при обычном освещении сверху. Поверхность MR-элемента выглядит ровной.


Общий вид микрорельефа MR-элемента головок диска Seagate ST3160215AS, под прямым источником света

Ну а теперь давайте включим «контровый» свет. Картинка рельефа преобразилась: там, где у нас при обычном освещении видны углубления, при двойном освещении они выглядят, как выпуклости, а «зернистость» поверхности заметно увеличена.

У диска с меньшим износом поверхности MR-элемента размер зерна относительно мельче, но самое главное – нет крупных выбоин. Диск с большей степенью износа обладает относительно более крупной зернистостью и имеет хорошо видимые крупные выбоины на поверхности MR-элемента.

Разная степень зернистости микрорельефа одного участка поверхности MR-элемента головок накопителей Seagate ST3160215AS c разной степенью износа, масштаб 100%.


Общи вид микрорельефа поверхности MR-элемента головок накопителей Seagate ST3160215AS c разной степенью износа

Заключение

Вы можете помочь и перевести немного средств на развитие сайта

Читайте также:  Как восстановить работу клавиатуры на ноутбуке

admin

Добавить комментарий

Ваш e-mail не будет опубликован. Обязательные поля помечены *