Auch nach Löschung von Dateien: Restkapazität HDD bleibt gleich!

testit

Well-Known Member
Hallo,

ich habe folgendes Problem:

Webmin-Systeminfos weist aus:

Lokale HDD-Speicherkapazität: 724.85 GB gesamt / 71.36 GB freien / 653.49 GB genutzt
(Anm.: Es sind zwei 750GB-Platten von Samsung verbaut).

Da ich haufenweise die Fehlermeldung
"kernel: swap_pager_getswapspace(16): failed"
erhalte, wollte ich Platz auf der Platte schaffen.

Ich habe mehr als 100GB gelöscht, aber es bleibt auch danach stets bei der Anzeige
724.85 GB gesamt / 71.36 GB freien / 653.49 GB genutzt

Ebenso merkwürdig:

Ein
du -c -d1 -h
gibt aus

1.5k ./mnt
1.5k ./media
90M ./tmp
4.9M ./rescue
2.5k ./dev
29G ./var
518k ./libexec
5.2M ./sbin
128M ./boot
1.3M ./bin

und scheint dann einfach nicht mehr weiterzuarbeiten bzw. es erfolgt kein weiterer Output mehr.

Bei einem Windows-OS würde ich nun chkdsk laufen lassen.

df gibt aus:
Code:
Filesystem    1K-blocks      Used     Avail Capacity  Mounted on
tank/root     678796315 272130110 406666204    40%    /
devfs                 1         1         0   100%    /dev
tank/root/tmp 406758706     92502 406666204     0%    /tmp
tank/root/var 437862792  31196588 406666204     7%    /var

mount
Code:
tank/root on / (zfs, local, nfsv4acls)
devfs on /dev (devfs, local, multilabel)
tank/root/tmp on /tmp (zfs, local, nfsv4acls)
tank/root/var on /var (zfs, local, nfsv4acls)


Hat jemand eine Idee, worauf o. a. Problematik zurückzuführen sein könnte und was ich tun kann, damit die Restkapazität der Platten wieder korrekt angezeigt wird? Die SMART-Test-Ergebnisse habe ich nachstehend angefügt.

Code:
PLATTE#1

Offline data collection statusOffline data collection activity was never started.
Auto Offline Data Collection: Disabled.
Self-test execution statusThe previous self-test routine completed without error or no self-test has ever  been run.
Total time to complete Offline  data collection9238 seconds.
Offline data collection capabilitiesSMART execute Offline immediate.
Auto Offline data collection on/off support.
Suspend Offline collection upon new command.
Offline surface scan supported.
Self-test supported.
Conveyance Self-test supported.
Selective Self-test supported.
SMART capabilitiesSaves SMART data before entering power-saving mode.
Supports SMART auto save timer.
Error logging capabilityError logging supported.
General Purpose Logging supported.
Short self-test routine  recommended polling time2 minutes.
Extended self-test routine recommended polling time155 minutes.
Conveyance self-test routine recommended polling time17 minutes.
SCT capabilitiesSCT Status supported.
SCT Error Recovery Control supported.
SCT Feature Control supported.
SCT Data Table supported.
Raw Read Error Rate0  (Normalisiert: 100)
Spin Up Time6190  (Normalisiert: 082)
Start Stop Count9  (Normalisiert: 100)
Reallocated Sector Ct0  (Normalisiert: 100)
Seek Error Rate0  (Normalisiert: 100)
Seek Time Performance10522  (Normalisiert: 100)
Power On Hours69357  (Normalisiert: 086)
Spin Retry Count0  (Normalisiert: 100)
Calibration Retry Count0  (Normalisiert: 100)
Power Cycle Count9  (Normalisiert: 100)
Read Soft Error Rate0  (Normalisiert: 100)
Runtime Bad Block0  (Normalisiert: 100)
End-to-End Error0  (Normalisiert: 100)
Reported Uncorrect16  (Normalisiert: 100)
Command Timeout0  (Normalisiert: 100)
Airflow Temperature Cel35  (Normalisiert: 065)
Temperature Celsius41  (Normalisiert: 059)
Hardware ECC Recovered753672494  (Normalisiert: 100)
Reallocated Event Count0  (Normalisiert: 100)
Current Pending Sector0  (Normalisiert: 100)
Offline Uncorrectable0  (Normalisiert: 100)
Multi Zone Error Rate0  (Normalisiert: 100)
Soft Read Error Rate0  (Normalisiert: 100)

Voller SMART Status Bericht
smartctl 6.0 2012-10-10 r3643 [FreeBSD 8.4-RELEASE-p16 amd64] (local build)
Copyright (C) 2002-12, Bruce Allen, Christian Franke, www.smartmontools.org

=== START OF INFORMATION SECTION ===
Model Family:     SAMSUNG SpinPoint F1 DT
Device Model:     SAMSUNG HD753LJ
Serial Number:    S13UJ1BZ400075
LU WWN Device Id: 5 0024e9 0035e8563
Firmware Version: 1AA01118
User Capacity:    750,156,374,016 bytes [750 GB]
Sector Size:      512 bytes logical/physical
Device is:        In smartctl database [for details use: -P show]
ATA Version is:   ATA/ATAPI-7, ATA8-ACS T13/1699-D revision 3b
Local Time is:    Wed Jun 13 13:03:15 2018 CEST
SMART support is: Available - device has SMART capability.
SMART support is: Enabled

=== START OF READ SMART DATA SECTION ===
SMART overall-health self-assessment test result: PASSED

General SMART Values:
Offline data collection status:  (0x00)Offline data collection activity
was never started.
Auto Offline Data Collection: Disabled.
Self-test execution status:      (   0)The previous self-test routine completed
without error or no self-test has ever
been run.
Total time to complete Offline
data collection: ( 9238) seconds.
Offline data collection
capabilities:  (0x7b) SMART execute Offline immediate.
Auto Offline data collection on/off support.
Suspend Offline collection upon new
command.
Offline surface scan supported.
Self-test supported.
Conveyance Self-test supported.
Selective Self-test supported.
SMART capabilities:            (0x0003)Saves SMART data before entering
power-saving mode.
Supports SMART auto save timer.
Error logging capability:        (0x01)Error logging supported.
General Purpose Logging supported.
Short self-test routine
recommended polling time:  (   2) minutes.
Extended self-test routine
recommended polling time:  ( 155) minutes.
Conveyance self-test routine
recommended polling time:  (  17) minutes.
SCT capabilities:        (0x003f)SCT Status supported.
SCT Error Recovery Control supported.
SCT Feature Control supported.
SCT Data Table supported.

SMART Attributes Data Structure revision number: 16
Vendor Specific SMART Attributes with Thresholds:
ID# ATTRIBUTE_NAME          FLAG     VALUE WORST THRESH TYPE      UPDATED  WHEN_FAILED RAW_VALUE
  1 Raw_Read_Error_Rate     0x000f   100   099   051    Pre-fail  Always       -       0
  3 Spin_Up_Time            0x0007   082   082   011    Pre-fail  Always       -       6190
  4 Start_Stop_Count        0x0032   100   100   000    Old_age   Always       -       9
  5 Reallocated_Sector_Ct   0x0033   100   100   010    Pre-fail  Always       -       0
  7 Seek_Error_Rate         0x000f   100   100   051    Pre-fail  Always       -       0
  8 Seek_Time_Performance   0x0025   100   100   015    Pre-fail  Offline      -       10522
  9 Power_On_Hours          0x0032   086   086   000    Old_age   Always       -       69357
10 Spin_Retry_Count        0x0033   100   100   051    Pre-fail  Always       -       0
11 Calibration_Retry_Count 0x0012   100   100   000    Old_age   Always       -       0
12 Power_Cycle_Count       0x0032   100   100   000    Old_age   Always       -       9
13 Read_Soft_Error_Rate    0x000e   100   099   000    Old_age   Always       -       0
183 Runtime_Bad_Block       0x0032   100   100   000    Old_age   Always       -       0
184 End-to-End_Error        0x0033   100   100   000    Pre-fail  Always       -       0
187 Reported_Uncorrect      0x0032   100   100   000    Old_age   Always       -       16
188 Command_Timeout         0x0032   100   100   000    Old_age   Always       -       0
190 Airflow_Temperature_Cel 0x0022   065   062   000    Old_age   Always       -       35 (Min/Max 32/38)
194 Temperature_Celsius     0x0022   059   059   000    Old_age   Always       -       41 (Min/Max 32/43)
195 Hardware_ECC_Recovered  0x001a   100   100   000    Old_age   Always       -       753672494
196 Reallocated_Event_Count 0x0032   100   100   000    Old_age   Always       -       0
197 Current_Pending_Sector  0x0012   100   100   000    Old_age   Always       -       0
198 Offline_Uncorrectable   0x0030   100   100   000    Old_age   Offline      -       0
199 UDMA_CRC_Error_Count    0x003e   100   100   000    Old_age   Always       -       0
200 Multi_Zone_Error_Rate   0x000a   100   100   000    Old_age   Always       -       0
201 Soft_Read_Error_Rate    0x000a   100   099   000    Old_age   Always       -       0

SMART Error Log Version: 1
No Errors Logged

SMART Self-test log structure revision number 1
Num  Test_Description    Status                  Remaining  LifeTime(hours)  LBA_of_first_error
# 1  Short offline       Completed without error       00%     42099         -

SMART Selective self-test log data structure revision number 1
SPAN  MIN_LBA  MAX_LBA  CURRENT_TEST_STATUS
    1        0        0  Not_testing
    2        0        0  Not_testing
    3        0        0  Not_testing
    4        0        0  Not_testing
    5        0        0  Not_testing
Selective self-test flags (0x0):
  After scanning selected spans, do NOT read-scan remainder of disk.
If Selective self-test is pending on power-up, resume after 0 minute delay.

------------

Code:
Platte#2

smartctl 6.0 2012-10-10 r3643 [FreeBSD 8.4-RELEASE-p16 amd64] (local build)
Copyright (C) 2002-12, Bruce Allen, Christian Franke, www.smartmontools.org

=== START OF INFORMATION SECTION ===
Model Family:     SAMSUNG SpinPoint F1 DT
Device Model:     SAMSUNG HD753LJ
Serial Number:    S13UJ1BZ400074
LU WWN Device Id: 5 0024e9 0035e8555
Firmware Version: 1AA01118
User Capacity:    750,156,374,016 bytes [750 GB]
Sector Size:      512 bytes logical/physical
Device is:        In smartctl database [for details use: -P show]
ATA Version is:   ATA/ATAPI-7, ATA8-ACS T13/1699-D revision 3b
Local Time is:    Wed Jun 13 13:07:23 2018 CEST
SMART support is: Available - device has SMART capability.
SMART support is: Enabled

=== START OF READ SMART DATA SECTION ===
SMART overall-health self-assessment test result: PASSED

General SMART Values:
Offline data collection status:  (0x00)Offline data collection activity
was never started.
Auto Offline Data Collection: Disabled.
Self-test execution status:      (   0)The previous self-test routine completed
without error or no self-test has ever
been run.
Total time to complete Offline
data collection: ( 9671) seconds.
Offline data collection
capabilities:  (0x7b) SMART execute Offline immediate.
Auto Offline data collection on/off support.
Suspend Offline collection upon new
command.
Offline surface scan supported.
Self-test supported.
Conveyance Self-test supported.
Selective Self-test supported.
SMART capabilities:            (0x0003)Saves SMART data before entering
power-saving mode.
Supports SMART auto save timer.
Error logging capability:        (0x01)Error logging supported.
General Purpose Logging supported.
Short self-test routine
recommended polling time:  (   2) minutes.
Extended self-test routine
recommended polling time:  ( 162) minutes.
Conveyance self-test routine
recommended polling time:  (  18) minutes.
SCT capabilities:        (0x003f)SCT Status supported.
SCT Error Recovery Control supported.
SCT Feature Control supported.
SCT Data Table supported.

SMART Attributes Data Structure revision number: 16
Vendor Specific SMART Attributes with Thresholds:
ID# ATTRIBUTE_NAME          FLAG     VALUE WORST THRESH TYPE      UPDATED  WHEN_FAILED RAW_VALUE
  1 Raw_Read_Error_Rate     0x000f   100   099   051    Pre-fail  Always       -       0
  3 Spin_Up_Time            0x0007   082   082   011    Pre-fail  Always       -       6320
  4 Start_Stop_Count        0x0032   100   100   000    Old_age   Always       -       9
  5 Reallocated_Sector_Ct   0x0033   100   100   010    Pre-fail  Always       -       0
  7 Seek_Error_Rate         0x000f   100   100   051    Pre-fail  Always       -       0
  8 Seek_Time_Performance   0x0025   100   100   015    Pre-fail  Offline      -       10939
  9 Power_On_Hours          0x0032   086   086   000    Old_age   Always       -       69357
10 Spin_Retry_Count        0x0033   100   100   051    Pre-fail  Always       -       0
11 Calibration_Retry_Count 0x0012   100   100   000    Old_age   Always       -       0
12 Power_Cycle_Count       0x0032   100   100   000    Old_age   Always       -       9
13 Read_Soft_Error_Rate    0x000e   100   099   000    Old_age   Always       -       0
183 Runtime_Bad_Block       0x0032   100   100   000    Old_age   Always       -       0
184 End-to-End_Error        0x0033   100   100   000    Pre-fail  Always       -       0
187 Reported_Uncorrect      0x0032   100   100   000    Old_age   Always       -       16
188 Command_Timeout         0x0032   100   100   000    Old_age   Always       -       0
190 Airflow_Temperature_Cel 0x0022   070   067   000    Old_age   Always       -       30 (Min/Max 27/33)
194 Temperature_Celsius     0x0022   065   065   000    Old_age   Always       -       35 (Min/Max 27/37)
195 Hardware_ECC_Recovered  0x001a   100   100   000    Old_age   Always       -       974857997
196 Reallocated_Event_Count 0x0032   100   100   000    Old_age   Always       -       0
197 Current_Pending_Sector  0x0012   100   100   000    Old_age   Always       -       0
198 Offline_Uncorrectable   0x0030   100   100   000    Old_age   Offline      -       0
199 UDMA_CRC_Error_Count    0x003e   100   100   000    Old_age   Always       -       0
200 Multi_Zone_Error_Rate   0x000a   100   100   000    Old_age   Always       -       0
201 Soft_Read_Error_Rate    0x000a   100   099   000    Old_age   Always       -       0

SMART Error Log Version: 1
No Errors Logged

SMART Self-test log structure revision number 1
Num  Test_Description    Status                  Remaining  LifeTime(hours)  LBA_of_first_error
# 1  Short offline       Completed without error       00%     42099         -

SMART Selective self-test log data structure revision number 1
SPAN  MIN_LBA  MAX_LBA  CURRENT_TEST_STATUS
    1        0        0  Not_testing
    2        0        0  Not_testing
    3        0        0  Not_testing
    4        0        0  Not_testing
    5        0        0  Not_testing
Selective self-test flags (0x0):
  After scanning selected spans, do NOT read-scan remainder of disk.
If Selective self-test is pending on power-up, resume after 0 minute delay.




Danke und viele Grüße
testit
 
Hi,

/usr ist sicherlich ziemlich groß und noch nicht in der Ausgabe zu finden.
Warte einfach mal ab, bis du fertig ist.

Du kannst dir den Fortschritt anzeigen lassen, in dem du nachschaust, welches Verzeichnis du gerade einliest.
Dazu zweite Konsole öffnen und die PID des du-Prozesses herausbekommen. Damit dann procstat füttern:

Code:
# ps aux | grep du
# procstat -f <pid>

Rob
 
Hallo Rob,

in der Tat ist du doch noch durchgelaufen und gibt aus:

Code:
du -c -d1 -h
1.5k    ./mnt
1.5k    ./media
 90M    ./tmp
4.9M    ./rescue
2.5k    ./dev
 29G    ./var
518k    ./libexec
5.2M    ./sbin
128M    ./boot
1.3M    ./bin

150G    ./usr
8.8G    ./backups
  4M    ./etc
101G    ./root
1.5k    ./proc
8.8M    ./lib
290G    .
290G    total

Daher verstehe ich nicht die Anzeige von Webmin, die ja auch m. E. die Fehlermeldungen §kernel: swap_pager_getswapspace(X, wobei x =3,16 etc.)): failed" erklären könnte.

FRAGE: Wie kann ich prüfen, ob ich seinerzeit die beiden 750er-Platten mit Softwareraid eingerichtet hatte?

Danke und viele Grüße
testit
 
Zeig doch mal "zpool status", "zfs list", und "zfs list -t snap".

Vielen Dank für´s Einklinken:

zpool status
Code:
  pool: tank
 state: ONLINE
status: The pool is formatted using a legacy on-disk format.  The pool can
        still be used, but some features are unavailable.
action: Upgrade the pool using 'zpool upgrade'.  Once this is done, the
        pool will no longer be accessible on software that does not support feature
        flags.
  scan: none requested
config:

        NAME        STATE     READ WRITE CKSUM
        tank        ONLINE       0     0     0
          mirror-0  ONLINE       0     0     0
            ad4p3   ONLINE       0     0     0
            ad6p3   ONLINE       0     0     0

errors: No known data errors

zflist
Code:
NAME            USED  AVAIL  REFER  MOUNTPOINT
tank            290G   388G    21K  none
tank/root       290G   388G   260G  /
tank/root/tmp  90.3M   388G  90.3M  /tmp
tank/root/var  30.0G   388G  30.0G  /var

zfs list -t snap wirft einen Syntaxfehler:
Code:
invalid type
 
FRAGE: Wie kann ich prüfen, ob ich seinerzeit die beiden 750er-Platten mit Softwareraid eingerichtet hatte?

Äh...ZFS ist immer softwareraid.

'zpool history' gibt dir die Befehle, die jemals dazu abgesetzt wurden.

status: The pool is formatted using a legacy on-disk format. The pool can still be used, but some features are unavailable. action: Upgrade the pool using 'zpool upgrade'. Once this is done, the pool will no longer be accessible on software that does not support feature flags
Hat zwar mit dem Thema nix zu tun, sollte aber gemacht werden. Siehe weiter unten.

zfs list -t snap wirft einen Syntaxfehler: -> wenn du keine snapshots vom pool hast, kommt auch nix. Ich meine aber, dass das eher daran liegt, dass der pool noch nicht upgegraded wurde.
Prüfbar mit 'zpool get version <pool>'. Entweder kommt die Versionsnummer (irgendwas v28 oder v29) oder ein '-', was die Version 5000 mit eben besagten feature flags wäre.

Was den swap betrifft....gib mir mal 'gpart show ad4' und 'gpart show ad6' und 'df -h' direkt von der console ohne webmin-gedöhns.
Da ich sehe, dass dein ZFS auf p3 jeweils verweilt, sollte die p2 die swap-partition sein. Da hilft es nicht, Dateien zu löschen, wenn die swap-partition gar nicht mit Dateien gefüllt ist.

webmin ist nicht pralle für bsd optimiert, das stiefelt besser auf linux.
 
Zuletzt bearbeitet:
Danke @all!

Ich hätte nicht vermutet, dass Webmin - da so lange auf dem "Markt" - hier keine korrekten Werte anzeigt.

Nochmals zu meinem swap_pager_getswapspace-Problem:

swapinfo gibt aus:

Device 1K-blocks Used Avail Capacity
/dev/gptid/c379dbd8-62a1-11e0-a 8388608 8378232 10376 100%

Wie bekomme ich die Ursache für die Swap-Pager-Fehlermeldung in den Griff?


Herzlichen Dank und viele Grüße
testit
 
Lies mal meinen Nachbeitrag von weiter oben. Gib mir die Werte und jetzt noch zusätzlich was in deiner 'etc/fstab' drin steht.
 
Hallo,

ich habe Deinen Nachtrag oben gelesen, aber halte mich derzeit von einem "zpool upgrade " lieber fern, weil ich vor einiger Zeit extrem Probleme mit zpool hatte (kann man hier im Forum nachlesen) und fürchte, dass ich wieder etwas lostrete.

/etc/fastab:


/dev/gptid/c379dbd8-62a1-11e0-a80e-406186f54297 none swap sw 0 0

Viele Grüße
testit
 
Hi,

swapinfo gibt aus:

Device 1K-blocks Used Avail Capacity
/dev/gptid/c379dbd8-62a1-11e0-a 8388608 8378232 10376 100%

Wie bekomme ich die Ursache für die Swap-Pager-Fehlermeldung in den Griff?

Du brauchst einfach mehr swap oder mehr Arbeitsspeicher. Das sollte aus der Ausgabe von swapinfo ersichtlich sein.

Rob
 
Was den swap betrifft....gib mir mal 'gpart show ad4' und 'gpart show ad6' und 'df -h' direkt von der console ohne webmin-gedöhns.
Da ich sehe, dass dein ZFS auf p3 jeweils verweilt, sollte die p2 die swap-partition sein. Da hilft es nicht, Dateien zu löschen, wenn die swap-partition gar nicht mit Dateien gefüllt ist.

Das würd ich gern noch sehen.
Ich vermute, die swap-partitionen sind nicht korrekt eingebunden.

extrem Probleme mit zpool hatte (kann man hier im Forum nachlesen) und fürchte, dass ich wieder etwas lostrete.
Hast du einen Link für mich? Ich rate ins Blaue, dass die swap-Probleme davon kommen.

Zum Pool-Upgrade schrieb ich ja nur 'sollte'...aber ich versteh dich da. ;)
 
Stand Dezember 2017: webmin kann mit ZFS nicht umgehen ("ZFS not recognized by default"), ich meinte das war aktuell noch immer ungelöst, müsste mal danach im Net suchen...
 
Das würd ich gern noch sehen.
Ich vermute, die swap-partitionen sind nicht korrekt eingebunden.
....

Hi,

unten sind die gewünschten Ausgaben.

Was mich wundert: Bei meinem Apache Webserver 2.2.X (prefork) zeigt "top" an, dass jeder httpd-Prozess ca. 512 MB in Anspruch nimmt. Das ist m. E. bei 8GB RAM zuviel und vermutlich auf die ganzen geladenen Module (LoadModule ... in httpd.conf) zurückzuführen. Da werde ich erst einmal herausfinden müssen, welche Module wahrscheinlich niemals benötigt werden und diese auskommentieren.

Viele Grüße
testit

gpart show ad4
=> 34 1465149101 ad4 GPT (698G)
34 128 1 freebsd-boot (64k)
162 16777216 2 freebsd-swap (8.0G)
16777378 1448371757 3 freebsd-zfs (690G)

gpart show ad6

=> 34 1465149101 ad6 GPT (698G)
34 128 1 freebsd-boot (64k)
162 16777216 2 freebsd-swap (8.0G)

df -h
Filesystem Size Used Avail Capacity Mounted on
tank/root 646G 259G 386G 40% /
devfs 1.0k 1.0k 0B 100% /dev
tank/root/tmp 386G 90M 386G 0% /tmp
tank/root/var 417G 31G 386G 7% /var
 
Stand Dezember 2017: webmin kann mit ZFS nicht umgehen ("ZFS not recognized by default"), ich meinte das war aktuell noch immer ungelöst, müsste mal danach im Net suchen...

Man glaubt es kaum: Habe eben mal Webmin aktualisiert und schon wird die Plattenkapazität richtig angezeigt.
Allerdings ging dies auch mit früheren Webmin-Versionen bei mir einwandfrei. Der Fehler scheint sich in einer der letzten Versionen eingeschlichen zu haben.

Viele Grüße und Danke für die Hinweise
testit
 
... die Samsung Platte hat fast 70000 Stunden auf dem Buckel, wie lange willst du die noch nutzen? 8Jahre Dauerbetrieb 24/7, gute Platte?:)
 
Auge richte Dein Auge auf die bereits geposteten SMART-Werte! Welche siehst Du als kritisch an?

Viele Grüße
testit
 
Hi,

unten sind die gewünschten Ausgaben.

Wie ichs mir dachte. Also folgendes...

Code:
swapoff /dev/gptid/c379dbd8-62a1-11e0-a80e-406186f54297

swapon /dev/ad4p2

swapon /dev/ad6p2

swapinfo

Wenn das so nun funktioniert, das Zahlengegrütze in /etc/fstab ersetzen und fürn reboot festnageln.

fstab:

Code:
/dev/ad4p2        none    swap    sw        0    0
/dev/ad6p2        none    swap    sw        0    0

Nach nem reboot wieder mit 'swapinfo' prüfen. Sollte so klappen. ;)

Mach das erstmal so, damit sollten deine Probleme verschwinden. Dein Sys konnte nicht swappen, daher die Fehlermeldungen und auch das Gemurks mit dem Apache.

... die Samsung Platte hat fast 70000 Stunden auf dem Buckel, wie lange willst du die noch nutzen? 8Jahre Dauerbetrieb 24/7, gute Platte?

Eigentlich wurscht (die haben ja bis auf die Laufzeit ansonsten unkritische Werte), aber bei NUR 2 Platten dann kritisch, wenn eine stirbt und das anschließende resilvern die übrig bleibende, alte Platte totfordert. Sofort viel IO und viel Hitze für ne Platte, die das nicht mehr gewohnt ist. -> kawumm!

Weil es hier wieder passt: Backup machen!
 
Zuletzt bearbeitet:
Exakt diesen tot ist damals mein Raid1 System gestorben. Während des Rebuild ist die "gute" Platte gestorben. Gottseidank hatte ich ein Backup. Sie hatte "nur" 22000h.
 
Das Thema, wann man eine Platte tauschen sollte und woran man ihren Zustand erkennt ist schon relativ komplex. Das Leid geht mit einer recht hohen Streuung zwischen verschiedenen Modellen los. Wenn man größere Populationen betreibt fällt schnell auf, dass die Lebensdauer tatsächlich in erster Linie vom Modell abhängig ist und man kaum nachvollziehbare Muster erkennt. Ein Modell ist relativ gut, der nach Datenplatten kaum veränderte Nachfolger vergleichsweise schlecht. Und solche Dinge. SMART ist dabei nur eine geringe Hilfe, da die Aussagekraft von zu vielen Faktoren abhängig ist. Wieder dem Modell, dem Hersteller und seiner Interpretation der Werte, der Firmware, etc. Dazu kommt die Frage, was man erreichen möchte. Für das Storage der großen Kontendatenbank einer Bank hat man andere Anforderungen als für ein einfaches Datengrab. Letztendlich läuft es aber immer auf eine von zwei Strategien heraus:
  • Präventivtausch anhand von zuvor festgelegten Kriterien wie z.B. dem Alter.
  • Tausch erst dann, wenn eine Festplatte kaputt ist.
 
Eben....und man sollte manche Risiken einfach mit Geld lösen.

Wie z.B. drei bis vierfache Redundanz(+BACKUP!). Mal 300€ mehr in die Hand genommen tut weniger weh, als dann die Rechnung von der Datenrettungsfirma mit ungewissem Ausgang oder eben Totalverlust.
 
Zurück
Oben