• Monitorare l’hard disk

    by  • giugno 24, 2007 • Altro informatica, GNU/Linux, Hardware, Smanettamenti, Software • 4 Comments • 5.640 visite

    Dopo aver recuperato il mio Maxtor dovevo controllare che non avesse errori fisici. Per farlo mi sono affidato a
    smartmontool, il quale sfrutta la tecnologia smart (tutti gli hard disk moderni sono smart capable).

    top.png

    Procediamo:

    Tutti i test possono essere fatti anche su un hard disk attualmente in uso

    Installiamo smart

    sudo apt-get install smartmontools

    Verifichiamo che l’hard disk supoprti smart

    sudo smartctl -i /dev/hdx

    Se leggiamo Avaible siamo a cavallo, se leggiamo disable digitiamo

    sudo smartctl -s on /dev/hdx

    Facciamo un primo test generico ma ugualmente importante…anzi forse più importante

    sudo smartctl -H /dev/hdx

    Se leggiamo passed possiamo proseguire, se leggiamo failed salviamo i dati di corsa e proviamo ad effettuare una formattazione a basso livello (la speranza è l’ultima a morire)

    Con :

    sudo smartctl -l error /dev/hda

    è possibile avere un log degli errori che il disco ha registrato ( SMART Error Log) a partire dalla prima volta che è stato messo in funzione; guardate se ci sono errori registrati, se non sono recenti non preoccupiamoci

    Proseguiamo con test più specifici:

    smartctl -t offline /dev/hda

    In questo modo eseguiamo lo SMART Immediate Offline Test, per vedere i risultati bisogna pazientare il programma vi dice quando finirà il test, dovrebbe infatti scrivere una cosa tipo “Please wait 2120 seconds for test to complete. Test will complete after Mon Jun 18 23:21:16 2007″. Per vedere i risultati del test visualizziamo lo SMART Error Log come descritto sopra.

    A questo punto eseguiamo a scelta lo SMART Short Self Test o lo SMART Extended Self Test, ovviamente il secondo è più approfondito del primo (mettere short al posto di long per evvettuare lo Short Self Test)

    smartctl -t long /dev/hda

    I risultati di entrambi i test vengono riportati nel Self Test Error Log:

    smartctl -l selftest /dev/hdx

    MONITORIAMO AUTOMATICAMENTE L’HARD DISK

    Quello che ho fatto è stato configurare il demone smartd in modo che facesse tutti questi test descritti fin’ora nell’arco di 4 ore (11-15) ogni 2 giorni circa (Lunedì Mercoledì Venerdì Domenica); la mia però è una situazione particolareil mio hard disk ne ha passate di tutti i colori, se non avete problemi particolari vi basterà fare i test 1 volta a settimana. Se il demone rileva qualche errore dovrà scrivere su un file di log l’errore e volendo dovrà anche spegnere il computer (per salvaguardare i dati).

    Quindi nel file /etc/smartd.conf ho scritto:

    /dev/hdx \
    -H \
    -l error -l selftest \
    -s (O/../../(1|3|5|7)/11|L/../../(1|3|5|7)/13|C/../../(1|3|5|7)/15) \
    -m ThisIsNotUsed -M exec /percorso_script

    Il contenuto dello script sarà invece:

    #!/bin/bash
    FILE=”/percorso_file_log”
    echo “$SMARTD_MESSAGE” >> “$FILE”
    halt

    Questi sono i miei script se volete modificarli vi rimando al man di smartd.conf

    Ora proviamo ad avviare il demone

    sudo /etc/init.d/smartd restart

    Dato che all’avvio del demone i test vengono fatti anche se non è il giorno prestabilito, se il file di log viene creato in teoria tutto funziona! Per avviare il demone all’avvio del computer in debian basta modificare /etc/default/smartmontools.

    MONITORARE LA TEMPERATURA

    Niente di più semplice, basta usare hddtemp

    sudo apt-get install hddtemp
    sudo hddtemp /dev/hdx

    Per monitorare la temperatura periodicamente si può usare cron

    sudo crontab -e

    Così si modificherà il file di cron, io l’ho impostato così

    # m h dom mon dow command
    0 0,4,8,12,16,20 * * * /bin/date >> /file_di_log
    0 0,4,8,12,16,20 * * * /usr/sbin/hddtemp /dev/hdx >> /file_di_log

    Così ogni 4 ore avrò nel mio file la data e la temperatura, come per smart io ho messo ogni 4 ore perchè ho paura che l’hard disk si fonda, modificate a piacimento!

    Buon monitoraggio!

    4 Responses to Monitorare l’hard disk

    1. giugno 26, 2007 at 4:30 pm

      Grazie per la guida, ce li ho solo io questi errori?

      utente@pc01:~$ sudo smartctl -l error /dev/hda | grep Error
      SMART Error Log Version: 1
      ATA Error Count: 193 (device log contains only the most recent five errors)
      ER = Error register [HEX]
      Error 193 occurred at disk power-on lifetime: 3048 hours (127 days 0 hours)
      40 d1 08 56 5f b6 e1 Error: UNC at LBA = 0x01b65f56 = 28729174
      Error 192 occurred at disk power-on lifetime: 3048 hours (127 days 0 hours)
      40 d1 08 de 5b 7a e1 Error: UNC at LBA = 0x017a5bde = 24796126
      Error 191 occurred at disk power-on lifetime: 3048 hours (127 days 0 hours)
      40 d1 08 de 5b 7a e1 Error: UNC at LBA = 0x017a5bde = 24796126
      Error 190 occurred at disk power-on lifetime: 3048 hours (127 days 0 hours)
      40 d1 08 de 5b 7a e1 Error: UNC at LBA = 0x017a5bde = 24796126
      Error 189 occurred at disk power-on lifetime: 3048 hours (127 days 0 hours)
      40 d1 78 0e c4 b7 e1 Error: UNC at LBA = 0x01b7c40e = 28820494
      utente@pc01:~$ sudo smartctl -l error /dev/hdb | grep Error
      SMART Error Log Version: 1
      ATA Error Count: 8176 (device log contains only the most recent five errors)
      ER = Error register [HEX]
      Error 8176 occurred at disk power-on lifetime: 1 hours (0 days 1 hours)
      10 51 2e 91 2b c9 f4 Error: IDNF at LBA = 0x04c92b91 = 80292753
      Error 8175 occurred at disk power-on lifetime: 1 hours (0 days 1 hours)
      10 51 2e 91 2b c9 f4 Error: IDNF at LBA = 0x04c92b91 = 80292753
      Error 8174 occurred at disk power-on lifetime: 1 hours (0 days 1 hours)
      10 51 2e 91 2b c9 f4 Error: IDNF at LBA = 0x04c92b91 = 80292753
      Error 8173 occurred at disk power-on lifetime: 1 hours (0 days 1 hours)
      10 51 2e 91 2b c9 f4 Error: IDNF at LBA = 0x04c92b91 = 80292753
      Error 8172 occurred at disk power-on lifetime: 1 hours (0 days 1 hours)
      10 51 2e 91 2b c9 f4 Error: IDNF at LBA = 0x04c92b91 = 80292753

      Firefox 2.0.0.3 Firefox 2.0.0.3 Ubuntu Ubuntu
      Mozilla/5.0 (X11; U; Linux i686; en-US; rv:1.8.1.3) Gecko/20061201 Firefox/2.0.0.3 (Ubuntu-feisty)
    2. giugno 26, 2007 at 6:57 pm

      credo siano dei blocchi/settori danneggiati…puoi anche andare avanti per un bel pò con pochi blocchi danneggiati non c’è nessuna controindicazione…infatti come puoi notare in hda l’errore è iniziato 127giorni fa.
      Io stesso sto usando il mio hard disk con 41 settori danneggiati…prima della formattazione a basso livello ne aveva qlc migliaia. Quindi a voler fare le cose fatte bene una formattazione a basso livello non gli farebbe male!

      Firefox 2.0.0.4 Firefox 2.0.0.4 Ubuntu Ubuntu
      Mozilla/5.0 (X11; U; Linux i686; en-US; rv:1.8.1.4) Gecko/20061201 Firefox/2.0.0.4 (Ubuntu-feisty)
    3. giugno 26, 2007 at 10:41 pm

      Non ne ho avute esperienze positive con la tecnologia smart. Avevo un Maxtor con dei valori perfetti… tutto di un tratto è partito meccanicamente (sdeenngg… sdeeng) e lo Smart monitor mi diceva TUTTO OK!!!!

      Sicuramente possono aiutare… ma non si deve ma fidare troppo!! :-)

      Firefox 2.0.0.3 Firefox 2.0.0.3 Ubuntu Ubuntu
      Mozilla/5.0 (X11; U; Linux i686; en-US; rv:1.8.1.3) Gecko/20061201 Firefox/2.0.0.3 (Ubuntu-feisty)
    4. giugno 27, 2007 at 4:45 pm

      Io incrocio le dita :)

      Firefox 2.0.0.4 Firefox 2.0.0.4 Ubuntu Ubuntu
      Mozilla/5.0 (X11; U; Linux i686; en-US; rv:1.8.1.4) Gecko/20061201 Firefox/2.0.0.4 (Ubuntu-feisty)

    Lascia un Commento

    L'indirizzo email non verrà pubblicato. I campi obbligatori sono contrassegnati *