atactl zur Festplattenueberwachung

k_e_x

Well-Known Member
Hallo zusammen,

ein neu bestellter Server hat leider Festplattenprobleme. Was mich daran nur wundert ist:
Code:
# /sbin/atactl /dev/wd0c smartstatus 
No SMART threshold exceeded
In Ordnung ...
Code:
# /sbin/atactl /dev/wd0c readattr    
Attributes table revision: 16
ID      Attribute name                  Threshold       Value   Raw
  1     Raw Read Error Rate               16            100     0x000000000000
  2     Throughput Performance            50            100     0x000000000000
  3     Spin Up Time                      24            120     0x000300a600a5
  4     Start/Stop Count                   0            100     0x00000000001b
  5    *Reallocated Sector Count           5              1     0x00000000075b
  7     Seek Error Rate                   67            100     0x000000000000
...
One or more threshold values exceeded!
Hm?! Irgendwie verstehe ich das nicht. Muesste smartstatus denn nicht auch ein threshold exceeded ausgeben?

Normalerweise habe ich so einen cronjob:
Code:
/sbin/atactl /dev/wd0c smartstatus >> /dev/null 2>&1

Der theoretisch dann eine Mail losschickt sobald Fehler auftauchen. Das ist natuerlich witzlos, wenn das mit dem startstatus gar nicht richtig funktioniert :-(
 
Hier nun die Erklaerung:
Bei smartstatus, soll die Festplatte bei einem Selbsttest erkennen ob es ein Problem gibt, und entsprechend ein Register setzen, was darauf hin abgefragt wird, d.h. die Festplatte ermittelt irgendwie "intelligent" (evtl. herstellerabhaengig), ob ein Problem vorliegt.

Bei readattr werden einfach alle thresholds und alle aktuellen Werte ausgelesen, und sobald ein threshold erreicht/ueberschritten wurde, kommt ein "exceeded".

Meine persoenliche Empfehlung deshalb waere:
atactl ... readattr | grep exceeded
als cronjob, statt:
atactl ... smartstatus 2>&1

Der genaue Vergleich kann hier nachgelesen werden:
atactl.c im OpenBSD CVS
 
Zurück
Oben