Monitorare l’hard disk

Dopo aver recuperato il mio Maxtor dovevo controllare che non avesse errori fisici. Per farlo mi sono affidato a
smartmontool, il quale sfrutta la tecnologia smart (tutti gli hard disk moderni sono smart capable).

top.png

Procediamo:

Tutti i test possono essere fatti anche su un hard disk attualmente in uso

Installiamo smart

sudo apt-get install smartmontools

Verifichiamo che l’hard disk supoprti smart

sudo smartctl -i /dev/hdx

Se leggiamo Avaible siamo a cavallo, se leggiamo disable digitiamo

sudo smartctl -s on /dev/hdx

Facciamo un primo test generico ma ugualmente importante…anzi forse più importante

sudo smartctl -H /dev/hdx

Se leggiamo passed possiamo proseguire, se leggiamo failed salviamo i dati di corsa e proviamo ad effettuare una formattazione a basso livello (la speranza è l’ultima a morire)

Con :

sudo smartctl -l error /dev/hda

è possibile avere un log degli errori che il disco ha registrato ( SMART Error Log) a partire dalla prima volta che è stato messo in funzione; guardate se ci sono errori registrati, se non sono recenti non preoccupiamoci

Proseguiamo con test più specifici:

smartctl -t offline /dev/hda

In questo modo eseguiamo lo SMART Immediate Offline Test, per vedere i risultati bisogna pazientare il programma vi dice quando finirà il test, dovrebbe infatti scrivere una cosa tipo “Please wait 2120 seconds for test to complete. Test will complete after Mon Jun 18 23:21:16 2007″. Per vedere i risultati del test visualizziamo lo SMART Error Log come descritto sopra.

A questo punto eseguiamo a scelta lo SMART Short Self Test o lo SMART Extended Self Test, ovviamente il secondo è più approfondito del primo (mettere short al posto di long per evvettuare lo Short Self Test)

smartctl -t long /dev/hda

I risultati di entrambi i test vengono riportati nel Self Test Error Log:

smartctl -l selftest /dev/hdx

MONITORIAMO AUTOMATICAMENTE L’HARD DISK

Quello che ho fatto è stato configurare il demone smartd in modo che facesse tutti questi test descritti fin’ora nell’arco di 4 ore (11-15) ogni 2 giorni circa (Lunedì Mercoledì Venerdì Domenica); la mia però è una situazione particolareil mio hard disk ne ha passate di tutti i colori, se non avete problemi particolari vi basterà fare i test 1 volta a settimana. Se il demone rileva qualche errore dovrà scrivere su un file di log l’errore e volendo dovrà anche spegnere il computer (per salvaguardare i dati).

Quindi nel file /etc/smartd.conf ho scritto:

/dev/hdx \
-H \
-l error -l selftest \
-s (O/../../(1|3|5|7)/11|L/../../(1|3|5|7)/13|C/../../(1|3|5|7)/15) \
-m ThisIsNotUsed -M exec /percorso_script

Il contenuto dello script sarà invece:

#!/bin/bash
FILE=”/percorso_file_log”
echo “$SMARTD_MESSAGE” >> “$FILE”
halt

Questi sono i miei script se volete modificarli vi rimando al man di smartd.conf

Ora proviamo ad avviare il demone

sudo /etc/init.d/smartd restart

Dato che all’avvio del demone i test vengono fatti anche se non è il giorno prestabilito, se il file di log viene creato in teoria tutto funziona! Per avviare il demone all’avvio del computer in debian basta modificare /etc/default/smartmontools.

MONITORARE LA TEMPERATURA

Niente di più semplice, basta usare hddtemp

sudo apt-get install hddtemp
sudo hddtemp /dev/hdx

Per monitorare la temperatura periodicamente si può usare cron

sudo crontab -e

Così si modificherà il file di cron, io l’ho impostato così

# m h dom mon dow command
0 0,4,8,12,16,20 * * * /bin/date >> /file_di_log
0 0,4,8,12,16,20 * * * /usr/sbin/hddtemp /dev/hdx >> /file_di_log

Così ogni 4 ore avrò nel mio file la data e la temperatura, come per smart io ho messo ogni 4 ore perchè ho paura che l’hard disk si fonda, modificate a piacimento!

Buon monitoraggio!

4 risposte a “Monitorare l’hard disk”

  1. Grazie per la guida, ce li ho solo io questi errori?

    utente@pc01:~$ sudo smartctl -l error /dev/hda | grep Error
    SMART Error Log Version: 1
    ATA Error Count: 193 (device log contains only the most recent five errors)
    ER = Error register [HEX]
    Error 193 occurred at disk power-on lifetime: 3048 hours (127 days 0 hours)
    40 d1 08 56 5f b6 e1 Error: UNC at LBA = 0x01b65f56 = 28729174
    Error 192 occurred at disk power-on lifetime: 3048 hours (127 days 0 hours)
    40 d1 08 de 5b 7a e1 Error: UNC at LBA = 0x017a5bde = 24796126
    Error 191 occurred at disk power-on lifetime: 3048 hours (127 days 0 hours)
    40 d1 08 de 5b 7a e1 Error: UNC at LBA = 0x017a5bde = 24796126
    Error 190 occurred at disk power-on lifetime: 3048 hours (127 days 0 hours)
    40 d1 08 de 5b 7a e1 Error: UNC at LBA = 0x017a5bde = 24796126
    Error 189 occurred at disk power-on lifetime: 3048 hours (127 days 0 hours)
    40 d1 78 0e c4 b7 e1 Error: UNC at LBA = 0x01b7c40e = 28820494
    utente@pc01:~$ sudo smartctl -l error /dev/hdb | grep Error
    SMART Error Log Version: 1
    ATA Error Count: 8176 (device log contains only the most recent five errors)
    ER = Error register [HEX]
    Error 8176 occurred at disk power-on lifetime: 1 hours (0 days 1 hours)
    10 51 2e 91 2b c9 f4 Error: IDNF at LBA = 0x04c92b91 = 80292753
    Error 8175 occurred at disk power-on lifetime: 1 hours (0 days 1 hours)
    10 51 2e 91 2b c9 f4 Error: IDNF at LBA = 0x04c92b91 = 80292753
    Error 8174 occurred at disk power-on lifetime: 1 hours (0 days 1 hours)
    10 51 2e 91 2b c9 f4 Error: IDNF at LBA = 0x04c92b91 = 80292753
    Error 8173 occurred at disk power-on lifetime: 1 hours (0 days 1 hours)
    10 51 2e 91 2b c9 f4 Error: IDNF at LBA = 0x04c92b91 = 80292753
    Error 8172 occurred at disk power-on lifetime: 1 hours (0 days 1 hours)
    10 51 2e 91 2b c9 f4 Error: IDNF at LBA = 0x04c92b91 = 80292753

  2. credo siano dei blocchi/settori danneggiati…puoi anche andare avanti per un bel pò con pochi blocchi danneggiati non c’è nessuna controindicazione…infatti come puoi notare in hda l’errore è iniziato 127giorni fa.
    Io stesso sto usando il mio hard disk con 41 settori danneggiati…prima della formattazione a basso livello ne aveva qlc migliaia. Quindi a voler fare le cose fatte bene una formattazione a basso livello non gli farebbe male!

  3. Non ne ho avute esperienze positive con la tecnologia smart. Avevo un Maxtor con dei valori perfetti… tutto di un tratto è partito meccanicamente (sdeenngg… sdeeng) e lo Smart monitor mi diceva TUTTO OK!!!!

    Sicuramente possono aiutare… ma non si deve ma fidare troppo!! 🙂

  4. Io incrocio le dita 🙂

Lascia un commento