Bordmitteln oder SmartTools?

satriani

SysLion
Hallo,

gibt es Mitteln an Bord mit den man Zustand der Festplatten überwachen kann, sprich Temperatur, defekte Sektoren / Zylinder um den möglichen Ausfall zu vermeiden. Oder kommt man um SmartTools Installation nicht drum herum?

FreeBSD 9.1-RELEASE, ZFS, 2 Platten mit software RAID 1

LG.
 
Ich kenne nichts, was in der Standardinstallation die SMART Info auslesen kann. Allerdings funktioniert smartctl bei mir in der 9.x auch nicht mehr...
 
Jepp, wenn es nicht funktioniert, ist der Port deutlich zu alt. Die smartmontools wurden erst einige Zeit nach 9.0 auf das neue ATA-Subsystem angepasst. Einfach mal eine aktuelle Version des Ports bauen, dann geht das schon. :)
 
Dann ist der pkgng Build wohl auch noch etwas zu alt. Ich habe smartmontools-5.43 vom 9.1 pkg Server bekommen. Ab welcher Version müsste es denn funktionieren?
 
Hallo Ed1949,

mir ging es nach dem Umstieg zur 9.0 ebenso, dieser Syntax hat dann letztlich mit meiner IDE Platte geklappt:

Code:
/usr/local/sbin/smartctl -a --device=atacam /dev/ada0

Gruß
Shakky
 
Und da stellt sich die Frage, wieso man das Basissystem weiter aufblähen sollte - eigentlich möchte man es gern weiter verschlanken - wenn es eine hervorragende Drittanbietersoftware gibt.
 
Naja, die Abhängigkeit ist nicht sonderlich groß :rolleyes:
Requires: gettext-0.18.1.1, gmake-3.82_1, libiconv-1.14
aber, mir geht es hier rein um Prinzip. Ich versuche gerade ein System aufzustellen mit einem, sagen wir mal paranoiden Grad 12 von 10 :D
 
mh, alles GPL...

Sowas gehört nicht in den Kernel. Ich streiche schon so meine Kernelconfig zusammen, um einen schlanken Kernel zu haben.
Der Aufwand smartctl zu installieren dürfte für den paranoiden Leidensdruck kein wirkliches Hindernis darstellen.

btw. smartd ist derzeit bei mir abgestellt, weil er bei meinen ollen SCSI-Platten segfaults raushaut.
 
Naja, ich würde mich bei Festplattensachen eher auf ein vernünftiges Dateisystem verlassen, als auf ein SMART-Wert. Bei mir hat ein SMART-Wert noch nie irgendwas sinnvolles ausgespuckt. Selbst alle meine kaputten Platten, hatten den Status "OK".
 
Bei mir ist es umgekehrt. Da steht schon alles seit langer Zeit auf Old_age oder Pre-fail. Und nach meinem Dafürhalten ist die Platte noch nicht wirklich alt (2 oder 3 Jahre). Gleiches gilt für die Platten in der Tinderbox, die sind weniger als 2 Jahre alt.

Wenn ich nach SMART Werten ginge müsste man Festplatten nach einem Jahr austauschen. Nach meiner Erfahrung halten Platten aber eher 10 Jahre. Es gibt nur gelegentlich Ausnahmen, die den Schnitt drücken.
 
Mooooment mal ... :cool: ich habe smartd auf meinen Servern laufen und die haben meistens recht gehabt und die Platten sind dann auch nach kurzer Zeit drauf elend verreckt.
Hängt natürlich vom Fehler ab, bei einem Wärmefehler passiert nichts, aber bei einem uncorrectable und einem Defekt im Raid, lebt die Platte meist nicht mehr lange zuverlässig.

just my 2 cents
 
Bei mir ist es umgekehrt. Da steht schon alles seit langer Zeit auf Old_age oder Pre-fail. Und nach meinem Dafürhalten ist die Platte noch nicht wirklich alt (2 oder 3 Jahre). Gleiches gilt für die Platten in der Tinderbox, die sind weniger als 2 Jahre alt.

Wenn ich nach SMART Werten ginge müsste man Festplatten nach einem Jahr austauschen. Nach meiner Erfahrung halten Platten aber eher 10 Jahre. Es gibt nur gelegentlich Ausnahmen, die den Schnitt drücken.

Das ist bei meinen alten IDE Platten auch heute noch so, die müssten auch schon längst den Löffel abgegeben haben, wenn es nach SMART geht.

Aber das moderne SATA "Öko Gelumpe" wie die berüchtigte WD Caviar Green hält nach meiner Erfahrung grade mal Ein bis zwei Jahre dann ist dort endgültig der Spass Vorbei, ganz großes Tennis war als mir ein ZPOOL innerhalb von zwei Tagen beide Spiegeldisken verreckt sind.

Ohne Überwachung steht man da ganz schnell dumm da. "Never trust the Rust"
 
Ich denke, daß SMART seine Berechtigung hat und auch eingesetzt werden sollte. Aber die Funktionalität muß nicht im Kernel verankert werden.

btw. ich traue weder Festplatten, noch den Angaben von SMART über jene :D
 
Das sehe ich zwar genauso, dass diese Funktionalität nicht im Kernel sein muss, , nicht mal im Basis-System, aber bei mir kommt es gelegentlich zu dem Problem, dass ich die Installation der sysutils/smartmontools vergesse und mich dann wundere, wieso smartctl nicht geht.
Das Finden und Installieren von solch relativ basisnahen Anwendungen (sysutils) könnte ich mir daher etwas vereinfacht vorstellen, indem ein Aufruf eines solchen Befehls im Basis-System einen kleinen Hinweis auf den zu installierenden Port bringt. Also, eine einfache Textausgabe, so lange, der Port nicht installiert ist, wenn ein Befehl mit smartctl oä eingegeben wird.

Naja, vielleicht wäre dann aber auch alles zu bequem.

Was die Haltbarkeit von Festplatten angeht, gibt es eine enorme Bandbreite auch innerhalb eines Types einer Marke und daher kaum eine gesicherte Vorhersage.
Gerade geht bei mir die dritte billig-Platte in meinem Fileserver kaputt (es gibt Hinweise) und die ist nun knapp vier Jahre am laufen. Die erste war nach etwa einem Jahr schon hin und dann laufen die anderen beiden ja noch weiter, doch alleine mit diesen Werten ist schon ein recht großer Bereich beschrieben.
 
OK, ich glaube wenn man auf ZFS setzt, dann braucht man kein smartmontools.
"zpool status" nach dem "zpool scrub" gibt schon bescheid, wenn es mit der Platte irgendwas nicht stimmt. Nur schade, dass man an die Temperatur ohne smartmontools nicht kommt.
Ich bastle gerade ein Script, der mir potentielle Gefahr eines Systemausfall per Email meldet.
Der Script wertet regelmäßig die CPU-Temperatur aus, beobachtet die Anzahl der Festplatten (Temperatur geht leider nicht), fragt "zpool status" ab.

Was würdet ihr noch vorschlagen und wie wertet man dies ausschließlich mit den Bordmitteln aus?
 
OK, ich glaube wenn man auf ZFS setzt, dann braucht man kein smartmontools.
"zpool status" nach dem "zpool scrub" gibt schon bescheid, wenn es mit der Platte irgendwas nicht stimmt. Nur schade, dass man an die Temperatur ohne smartmontools nicht kommt.
Ich bastle gerade ein Script, der mir potentielle Gefahr eines Systemausfall per Email meldet.
Der Script wertet regelmäßig die CPU-Temperatur aus, beobachtet die Anzahl der Festplatten (Temperatur geht leider nicht), fragt "zpool status" ab.

Was würdet ihr noch vorschlagen und wie wertet man dies ausschließlich mit den Bordmitteln aus?

am Besten gar nicht.

Nun lass dich mal nicht verunsichern.
Letztens hatten wir erst einen Thread, wo es um ein ähnliches Script ging und so etwas ist wirklich nützlich. Ich nutze seit langem auch eines und habe da auch von der letzten Diskussion und dem dort vorgestellten Script umgehend was übernommen.

Vielleicht ist es mal wieder eine Folge meines Alters, aber ich trau keinem Script und keinem Programm und schon gar nicht ihren Möglichkeiten. Wer ernsthaft daran interessiert ist, Zustandsmeldungen objektiv zu erhalten, der muss eine entsprechende Lösung außerhalb des laufenden Systems basteln und wer wirklich glaubt, dass irgendeine SW zuverlässig Ausfälle von HW voraussagen kann, ist ein armer dummer Tropf, der keine Ahnung von der Wirklichkeit hat.
Deshalb bleibt das meiner Ansicht nach ein vergebliches Bemühen, etwas in der Art realisieren zu wollen. Es ist ein probates Mittel, unbedarfte Kunden zu beeindrucken und evtl zu einem Kauf zu veranlassen, sie wenigstens in Sicherheit zu wägen, wenn man solche SW an Bord hat, aber es ist kein probates Mittel, die Zukunft vorher zu sagen.

Temperatur- und Geräuschmessung, meinetwegen auch das Monitoring von Spannungen, sind ein recht zuverlässiges Mittel, Ausfälle von Festplatten festzustellen. In geringem Maße auch vorher zu sagen. Die Messgeräte und -Methoden sollten auf spezieller HW erfolgen und dann unabhängig vom laufenden System übermittelt werden.
Alles andere ist meiner Ansicht nach Käse und den Aufwand nicht wert.

Es sei denn, du willst da etwas für dich selbst machen um wenigstens mal ein wenig mehr Information zu erhalten. Dann ist allerdings smartmontools unverzichtbar und liefert die besten Informationen, so lange alles gut läuft und meist sogar darüber hinaus. Es kann ein Dienst als Dämon laufen und Nachrichten absetzen. Alles ist sehr elegant und sicher. Alles, was du wollen könntest, ist enthalten. Wozu ein Script für die gleichen Aufgaben schreiben? Ist das weniger Aufwand? Sicherer? Bietet höhere Performance?

Wozu brauchst du ein so schmales System? Weil dein Installationsmedium das verlangt? Nimm ein größeres oder entfern mal all die nicht benötigten Sprachpakete, die meist mit installiert werden. Oder sieh mal bei FreeNAS nach, ob du es kleiner hin bekommst.

Ich verstehe Ehrgeiz und habe oft selbst welchen.
Aber in diesem Fall ist er nicht angesagt.
Lass dein System etwas größer werden und nutze die komfortablen Möglichkeiten, die dir fix und fertig angeboten werden.
 
Nur mal zur Vorgehensweise:
-> smartd lauscht an den Platten
-> uncorrectable error
-> Mail an root
-> smartctl -t long
-> Fehlermeldung
-> tauschen der HD

Damit bin ich bis jetzt sehr gut gefahren und meine Erfahrung zeigt, daß die Platten, die ich nicht getauscht habe, dann auch alle innerhalb von ein paar Monaten verreckt sind.
Das kann ich live nicht brauchen und schmeiße lieber etwas Hardware nch dem Problem.

Ein Skript zu basteln um ein Skript samt Daemon nicht zu nutzen, ist sicherlich Geschmackssache. make install clean, echo smartd="YES" und /usr/local/etc/smartd start ... bin ich schneller, als im Skript dazu basteln. :o
 
Danke Leute. Wie gesagt ich versuche soweit es geht ohne "make install" auszukommen und habe die ports nicht mal geholt. Ich möchte nur testen wie weit man in Punkto Monitoring, ausschließlich mit Bordmitteln von FreeBSD kommt. Was mir bis jetzt eingefallen ist, ist oben aufgelistet.
1) CPU-Temperatur überwachen
2) Anzahl der Festplatten
3) zpool status

Mehr fällt mir zurzeit nicht ein. Würde mich freuen wenn jemandem noch was einfällt.
 
Danke Leute. Wie gesagt ich versuche soweit es geht ohne "make install" auszukommen und habe die ports nicht mal geholt. Ich möchte nur testen wie weit man in Punkto Monitoring, ausschließlich mit Bordmitteln von FreeBSD kommt. Was mir bis jetzt eingefallen ist, ist oben aufgelistet.
1) CPU-Temperatur überwachen
2) Anzahl der Festplatten
3) zpool status

Mehr fällt mir zurzeit nicht ein. Würde mich freuen wenn jemandem noch was einfällt.

Bastel Dir halt Skripte, die jeweils einen der Faktoren abfragen und bei einem Fehler eine Mail schreiben, dann schmeißt Du die in cron und läßt die minütlich laufen.
Ich habe mal so ein Skript für die Last gebastelt und es war ganz amüsant zu sehen, wie gelangweilt die Kiste meistens war.
 
Ich habe bereits mir ein Skript gebastelt, der alle von mir aufgelistete Faktoren abfragt und mich per Email informiert falls ein Problem vorliegt. Die Frage war ob jemand noch weitere Faktoren vorschlagen kann, die ich meinem Skript hinzufügen könnte.
Aber einen Vorschlag hast du bereits gemacht, das mit der Last werde ich mal auch reinquetschen, danke dafür ;)
Wo ist hier eigentlich ein Danke-Button? :D
 
Zurück
Oben