При администрировании сервера мало просто знать, что он подключен к питанию к сети передачи данных, важно обеспечивать и его стабильную работоспособность. Впрочем о чем это я, это и так всем известно, хотя и без вступительного слова не обойтись.
 Так вот, одним из важных и нужных параметров стабильности работы является задача сохранения данных, которые хранятся на жестких дисках сервера. Как правило, это диски собранные в массив, то есть их несколько. Нам сейчас не важно какие это RAID массивы, нам важно то, насколько надежно работают сами диски. Ведь писать о потере информации, о последствиях тоже не стоит, все и так себе представляют какие это неприятности проблемы. Так вот, здесь задача администратора сервера будет заключаться в мониторинге дисков. Как уж часто производить этот мониторинг решать вам, раз в неделю или раз в 2-3 дня, но делать это просто необходимо!

Такая необходимость собственно возникла и у меня, когда съехав на новый хостинг (reg.ru - вообще тут любая мелочь, это все за деньги...) ...мне сказали, что мониторинг это уже дополнительная услуга, за которую они будут брать деньги, но лишних денег у меня нет, а значит будем мониторить сами. Вот по этому поводу и была написана статья.

Итак, у современных жестких дисков есть встроенная технология оценки состояния жёсткого диска самодиагностики, а также механизм предсказания времени выхода его из строя, так называемый S.M.A.R.T. (англ. Self-Monitoring, Analysis and Reporting Technology). По нему смотреть состояние наиболее информативно и удобно. Однако для начала надо поставить эту утилиту.

Ставим утилиту для просмотра SMART следующей командой, через скажем программу PuTTy под логином суперадминистратора командой: apt-get install smartmontools 

В итоге, вам будет представлена информация об установке. Вроде такой.

В моем случае уже было все поставлено, но с проблемами. Сами видите 2 файла не полностью установлены или удалены. В общем были ошибки, но функционал мониторинга работал. Так вот, после такой установки уже можно пробовать smart.

Далее можно применить команду sudo fdisk -l или просто fdisk -l    (*l - это маленькая L)


Эта команда позволит увидеть нам какие диски стоят на сервере. В нашем случае это dev/sda и dev/sdb со своими индексами 1, 2, 3... (* - серверы разные, поэтому и диски на картинках получились с разными индексами)

После того, как мы узнали какие вообще диски у нас стоят, то можем обращаться к ним через команду smartctl - A /dev/sda

Можно без индекса 1, 2, 3... У меня все работало. Опять же возникла лишь проблема в том, что на одном сервере через sudo smartctl, а на втором сразу через smartctl, смотрите картинки ниже.



 

Вот эту самую информацию можно считать наиболее важной для мониторинга жестких дисков. Для SSD дисков критичным будет показатель строки

5 Reallocated_Sector_Ct   0x0033   100   100   005    Pre-fail  Always

* - если показатель порядка 10 и тем более выше, то диск пора бы уже заменить. Остальные параметры тоже смотрим, но они бывают не столь критичны.

Так вот, этот способ мониторинга касался smart функции. Есть возможность проверить битые ячейки с помощью команды badblocks. Смотрите ее ввод с картинки и что она выдает.

Информации здесь меньше и представлена она более примитивно, но это тоже вариант.

В целом эта информация уже может помочь в мониторинге дискового пространства на сервера, главное не забывать это вообще делать и установить периодичный график проверки дисков. Это тоже важно!