Backup eines 11.2 TB zpool

Zirias

Well-Known Member
Ich betreibe privat einen Server mit 4 Platten zu je 4TB in einem Raid-Z1, das ergibt eine nutzbare Kapazität von ca 11.2 TB. Für alle Fälle hätte ich gerne ein vollständiges Backup.

Meine Idee: eine Maschine mit einer einzigen sehr großen (12TB?) Festplatte, die nur alle 2 bis 3 Wochen mal hochgefahren wird und per zfs send/receive auf den aktuellen Stand gebracht wird.

- Ist das so eine brauchbare Idee?
- Gibt es Festplatten, die sich für ein solches Nutzungsprofil besonders eignen?
- Sollte ich über andere Backup-Strategien nachdenken, wenn ja welche? (Muss aber halbwegs kostengünstig sein ...)

Danke und Grüße
Felix
 
Ist das so eine brauchbare Idee?
Ja, geht in Ordnung. Du solltest da aber auf einen mirror schreiben. Einfach aus Prinzip, weil sind dir die Daten nur die Kosten einer weiteren Platte wert?
Ab dieser Plattengröße (je länger die resilver-Zeit im Fall der Fälle ist, umso wahrscheinlicher stirbt währenddessen die nächste Platte) ist es schon halb fahrlässig kein raidz2 zu fahren.

Richtig ganz billig kannst du auch 2 externe (du willst hierfür USB3!) Platten benutzen. Die entweder gleichzeitig als mirror beschreiben oder nacheinander befüllen.

Du kannst alles verschlüsselt (selber verschlüsseln!) in die Cloud laden. Wie da die Kosten aussehen, weiß ich nicht. Meine Daten in fremde Hände ist ein no-go, aber vllt. ist das bei dir ja anders.
 
Ja, geht in Ordnung. Du solltest da aber auf einen mirror schreiben. Einfach aus Prinzip, weil sind dir die Daten nur die Kosten einer weiteren Platte wert?
Nunja, Platten in solchen Größen sind eben schon ziemlich teuer ... meine Hoffnung war, dass bei der Wahl der "richtigen" Platte die Ausfallwahrscheinlichkeit sehr gering ist -- gibt es Platten, die darauf optimiert sind, nur gelegentlich kurz hochgefahren zu werden um weiter beschrieben zu werden? Ich hatte mal etwas von "archive" Festplatten gelesen, meine ich mich zu erinnern? Ich würde wahrscheinlich mal mit einer Platte anfangen, einen Mirror kann man daraus später ja immer noch bauen...

Ab dieser Plattengröße (je länger die resilver-Zeit im Fall der Fälle ist, umso wahrscheinlicher stirbt währenddessen die nächste Platte) ist es schon halb fahrlässig kein raidz2 zu fahren.
Zum tatsächlichen Risiko liest man auch unterschiedliche Dinge. Dass es existiert ist mir natürlich bewusst, das ist mit ein Grund, dass ich mich ganz ohne Backup unwohl fühle. Würde ich bei raidz2 allerdings immer noch... kaputte Hardware ist ja nicht der einzig mögliche Grund für Datenverlust ;)

Richtig ganz billig kannst du auch 2 externe (du willst hierfür USB3!) Platten benutzen.
Sind USB-Platten nicht eher teurer? Oder geht es darum, dass ich dann keinen weiteren Rechner brauche? Den hätte ich sowieso, dafür tut es ja alte Hardware.

Du kannst alles verschlüsselt (selber verschlüsseln!) in die Cloud laden. Wie da die Kosten aussehen, weiß ich nicht. Meine Daten in fremde Hände ist ein no-go, aber vllt. ist das bei dir ja anders.
Das ist für mich in der Tat ebenfalls ein no-go :)
 
Meine Verhältnisse sind vielleicht ähnlich. Bei mir laufen nun sechs 4GB-Platten in einem RaidZ2. Das ergibt dann ähnliche Fragen hinsichtlich Backups und ich habe mich so entschieden, dass ich mehrere Datasets eingerichtet habe, die ich dann jeweils auf externe Medien sichere. Das größte Dataset belegt etwa 2,7G, was noch recht gut mit externen Platten auf USB3 bewältigt werden kann.
Ich bin dabei nicht einheitlich vorgegangen.
Für einige Datasets habe ich die externen Medien ebenfalls in ZFS und dann die Daten mit zfs send/recv übertragen.
Für andere Datasets nutze ich sogar NTFS zum Backup, weil ich die dann auch zusätzlich mit anderen Systemen benutzen könnte.
Abgleichen tue ich immer noch am liebsten mit rsync.

Wenn dir die Idee mit einer sehr großen Platte als Backup gefällt, warum nicht gleich in den PC einbauen?
Intern laufen Backups doch sehr viel schneller.
 
Meine Verhältnisse sind vielleicht ähnlich. Bei mir laufen nun sechs 4GB-Platten in einem RaidZ2.
Also ich denke mal das ist nicht vergleichbar, 4GB resilver sollte ja ziemlich schnell sein -- meine Platten sind jeweils 4TB groß :o

Das ergibt dann ähnliche Fragen hinsichtlich Backups und ich habe mich so entschieden, dass ich mehrere Datasets eingerichtet habe, die ich dann jeweils auf externe Medien sichere. Das größte Dataset belegt etwa 2,7G, was noch recht gut mit externen Platten auf USB3 bewältigt werden kann.
Das ist in der Tat auch ein interessanter Gedanke, ging mir so auch schon durch den Kopf. Vor allem weil ein großer Teil bei mir belegt wird von meiner DVD und Bluray Sammlung (per minidlna für die Fernseher im Haus bereitgestellt), das könnte ich natürlich aus dem Backup ausklammern. Wäre zwar ärgerlich, alles neu einzulesen, aber durchaus machbar. Dann würde eine sehr viel geringere Datenmenge übrigbleiben, eben nur das, wo wirklich Arbeit drin steckt...

Für das Komplettbackup spricht eben, dass es im Falle eines Falles mit sehr wenig Aufwand wiederhergestellt ist.

Wenn dir die Idee mit einer sehr großen Platte als Backup gefällt, warum nicht gleich in den PC einbauen?
Intern laufen Backups doch sehr viel schneller.
Natürlich auch eine Möglichkeit. Aber räumliche Trennung gibt noch ein bisschen mehr Sicherheit, der Server könnte ja abbrennen oder so ;)
 
bei der Wahl der "richtigen" Platte die Ausfallwahrscheinlichkeit sehr gering ist -- gibt es Platten, die darauf optimiert sind, nur gelegentlich kurz hochgefahren zu werden um weiter beschrieben zu werden?

Schlicht und einfach: Nope. :) Selbst die jährlichen Auswertungen von backblaze oder SMART-Warnungen geben nur eine ungefähre Richtung. Platten sterben einfach von jetzt auf gleich (Hersteller, Modell und Charge egal, so sollte man sich das verinnerlichen) und weil man im Netz mal ne Erfolgsgeschichte von wem hört, dass er noch was runterkratzen konnte...das macht keinen Spaß, spar also nicht am falschen Ende. Ich hab das auch schon durch und fand es nicht geil, nur noch halbe Bilder zu haben oder quietschende mp3s, weil man die Dateien nur noch defekt runterkratzen konnte.
WENN dir mal eine Platte verreckt, hast du schon genug Puls, keinen falschen Befehl zu tippen. Es knallt auch ziemlich, wenn der Kampfmittelräumdienst den blauen (...oder wars der rote Draht? :D) , durchknipst.

von "archive" Festplatten gelesen,
Du meinst das hier.
Kannst hier im Forum die Meinungen mal suchen, für dein Vorhaben nicht 'besser' oder robuster, bloß weil Helium drin ist.

kaputte Hardware ist ja nicht der einzig mögliche Grund für Datenverlust
Richtig, aber ZFS wird robuster, wenn mit mehr Redundanz gefüttert. Wenn dir die Karre vollständig abbrennt, ist natürlich nichts mehr da. Wenn z.B. das Mainboard gerade stirbt und du hast keinen Schreibvorgang, dann ist das trotzdem zu 99% safe.

Sind USB-Platten nicht eher teurer? Oder geht es darum, dass ich dann keinen weiteren Rechner brauche?
Nein und ja für letzteres. Eine USB-Platte ist nichts besonderes, das ist eine normale SATA-Platte im Gehäuse verbaut und mit USB-Controller versehen. Dh. du kannst ein USB 3.0-Gehäuse kaufen und eine Platte deiner Wahl verbauen. Ja, du brauchst dann keinen weiteren Rechner und die Platte kannst du stromlos in einem anderen Raum verwahren. Ein sog. Kaltbackup ist sicherer, zwei davon noch mehr. Wie Hubraum, kann man nicht genug haben. ;)

Wenn dir die Idee mit einer sehr großen Platte als Backup gefällt, warum nicht gleich in den PC einbauen?
Intern laufen Backups doch sehr viel schneller.
Gegenargumente: Weil bei z.B. Blitzeinschlag alle eingebauten Platten einen Schaden bekommen könnten und wenn die Backupplatte dauerhaft läuft, verschleißt sie schneller.

Nachtrag: Wenn du ihn 1-2x/Monat einschaltet, sind die Stromkosten ja egal. Hast du mal gegengerechnet, was eine 12TB-Platte kostet vs. soviele kleine Platten, dass du auch wieder auf 12TB netto mit raidz1 kommst? Also Kosten 1x12TB gegen nochmal 4x4TB, wie du es schon hast?

Nachtrag2: Falls du dich für die USB-Platte(n) entscheidest, prüfe, ob du USB3.0 Anschlüsse am Mainboard hast, sonst läuft die Platte nur mit 2.0 daran und das dauert ewig!

Nachtrag3: Weil du netto 11,irgendwas Kapazität hast, aber der Platz nur 50% gefüllt ist, brauchst du auch nur Backupkapazität für den belegten Platz. Da ich aber nicht weiß, wie schnell dein Datenbestand wächst, ist vllt. auf 12TB netto planen die beste Idee.
 
Nachtrag: Wenn du ihn 1-2x/Monat einschaltet, sind die Stromkosten ja egal. Hast du mal gegengerechnet, was eine 12TB-Platte kostet vs. soviele kleine Platten, dass du auch wieder auf 12TB netto mit raidz1 kommst? Also Kosten 1x12TB gegen nochmal 4x4TB, wie du es schon hast?
Öhm, achso. Nein. Aber das klingt definitiv nach einem Plan, werde ich tun, danke :)
 
4GB resilver sollte ja ziemlich schnell sein -- meine Platten sind jeweils 4TB
klarer Typo, hast du sicher auch so bewertet. Ich habe noch nicht weiter gelesen, aber logisch, 4T auch bei mir.

Gegenargumente: Weil bei z.B. Blitzeinschlag alle eingebauten Platten einen Schaden bekommen könnten und wenn die Backupplatte dauerhaft läuft, verschleißt sie schneller.

Wenn es die Situation hergibt, muss die da nicht dauernd laufen. Mit "Situation hergibt" meine ich, dass man den PC runterfahren kann und dann die Platte anhängen und dann wieder einschalten. Es gibt natürlich auch Hot-Swap-Rahmen, aber wer die denn schon? (Tatsächlich habe ich neulich welche verschenkt, na so was).

Eine USB-Platte ist nichts besonderes, das ist eine normale SATA-Platte im Gehäuse verbaut und mit USB-Controller
Es werden oft spezielle Platten benutzt, die nicht so heiß werden.
Wenn man aber die Platte frei liegen hat und nicht in ein Gehäuse zwängt, sollte das mit "normalen" HDs keine Probleme geben. Dafür gibt es USB3 zu SATA (oder auch anderen) Anschlusskabel und externe Spannungsversorgungen. Diese Dinger sind recht günstig und ohnehin empfehlenswert für den Bastler.
https://www.mindfactory.de/product_...oll-und-3-5Zoll-Festplatten--6175_664929.html
https://www.mindfactory.de/product_...rter-USB-3-0-ext--gt--SATA-22-Pin_994305.html
Nur mal als Beispiel, weil ich dort eh unter Wegs war. Es gibt viele unterschiedliche Modelle. Die Daten zu diesen habe ich nicht gelesen und möchte das auch nicht als Empfehlung verstanden sehen.
 
Nur als kleiner Denkansatz da hier von "eingebauten" Platten gesprochen wurde:
Die schützen nicht gegen:

  • Überspannung (Kann auch schon ein Netzteil sein das hochgeht)
  • Wasserschäden
  • Versehendliches löschen
Und meiner absoluter Top1-Grund der häufig übersehen wird:

  • Einbruch / Diebstahl

Potentielle einbrecher nehmen gerne erstmal alles mit was irgendwie nach elektronik aussieht.

Deswegen ist ein gutes Backup immer irgendwo "extern" und sei es auch nur irgenwo versteckt in der Garage oder so.
Ob man im privaten Umfeld aber wirklich z.B. eine Lösung mit zwei Datenträger braucht ist schwerer zu beantworten. (Also die man dann im wechsel auslagert um die Gefahr des schadens z.B. Während der aktualiserung des Backups zu minimieren.)
 
Zu den Gefahren füge ich noch Trojaner/Virus hinzu. Der kann noch so ausgetüftelt sein, an eine abgeklemmte Platte kommt er nicht ran.

Einbruch / Diebstahl
Stimmt. Auch hier nochmal: Verschlüsselung ist wichtig! Da hilft auch keine Cyber-Versicherung.

Ob man im privaten Umfeld aber wirklich z.B. eine Lösung mit zwei Datenträger braucht ist schwerer zu beantworten.
Man muss immer selber abwägen, wie wichtig die Daten sind. IT-Affinität unterstelle ich schon mal immer, sonst wären wir alle ja nicht hier und somit haben IT-Leute auch immer wichtige Dinge. ;)
Entweder steckt Arbeit in den Dateien oder z.B. alte Fotos, die bekommt man nie wieder.

Wenn man einmal Daten verloren hat, denkt man anders. Und zum 'Hätte ich nur...' soll es nicht kommen. :)
 
Ich hab mal ausversehen ein Bierglas umgeschmissen das dann in meinen PC gelaufenist ... genau auf die Festplatte die dann entsprechend verstarb. (Hatte aber ein 2 Wochen altes Backup).

In unser kleines RZ auf der Arbeit ist Wasser eingedrungen durch ein falsch verlegtes Rohr von der Klimaanlagen entwässerrung, das Wasser schoss dann u.A. aus der Klimaanlagen im hohen Bogen raus, die Serverschränke habens aber nur von der geschlossenebn Seite abbekommen, letzendlich entstand nur am Klimagerät ein Schaden.
 
Deswegen ist ein gutes Backup immer irgendwo "extern" und sei es auch nur irgenwo versteckt in der Garage oder so.

Diese Art der Paranoia kenne ich von zwei Kollegen, die regelmäßig Backups in feuerfesten Tresoren außerhalb des Wohnhauses unterbringen. Ich verstehe das auch. Wirklich!
Und vielleicht schielt das Schicksal gerade nun auf mich und meine Situation und löscht mir alle meine Daten durch einen Blitzschlag mit anschließendem Hausbrand. Vor kurzem hatte ich mir "alle meine Daten" beinahe selbst gelöscht ( https://www.bsdforen.de/threads/der-was-hast-du-heute-gelernt-thread.33786/post-310220 ).
Aber: sind Filme wirklich wichtige Daten?

Bei mir sind die "wirklich wichtigen Daten" eine Menge, die bequem auf einem USB-Stick in meiner Hosentasche Platz haben und dort auch verschlüsselt liegen. Außerdem auf anderen Medien und Rechnern auch außerhalb des Hauses. Diese Daten ändern sich auch kaum im Laufe der Zeit. Es kommt mal ein Dokument von einigen hundert KB hinzu, aber grundsätzlich ist das klein gegenüber den Daten, die "nicht wirklich wichtig" sind und dazu zähle ich auch die Daten meiner aktuellen Arbeiten. Die sind nicht SO wichtig. Ein regelmäßiges Backup auf zwei unterschiedliche Medien erfolgt automatisch, aber diese Medien befinden sich im gleichen Raum und wären einem Feuer relativ ungeschützt ausgesetzt. Nunja, wenn es hier wirklich mal ein Feuer in diesem Raum gibt, dann brauche ich mir vermutlich auch keine Gedanken mehr um diese Daten zu machen!

Diebstahl ist so was, das vollkommen außerhalb meiner Wahrnehmung liegt. Deshalb nenne ich auch Paranoia, wie sich die Kollegen verhalten. Die wohnen aber in Städten und erleben angeblich dauernd solche Szenarien. Ich wohne auf dem Land und hier haben die Leute tatsächlich die Türen noch nicht abgeschlossen.
Das ist leider ein sehr dramatisches Thema und führt ins OT. Es gibt natürlich Banden, die organisiert sind und Häuser ausplündern. Die kommen immer häufiger auch zu uns aufs Land. Besonders hier, wo es direkt drei Grenzen gibt, über die man verschwinden kann. Trotzdem igeln sich die Leute hier bisher nicht ein und wahren ihren Lebensstil. Das finde ich toll, weil das zu mir selbst auch gut passt.

Insgesamt ist es halt immer eine Frage der Strategie, die man für sich selbst beantworten muss.
Ich will da drei Kategorien einführen und nennen:
  • nice to have
  • easier to have
  • must to have
Das ist relativ willkürlich und am "to have" orientiert, also einer rein semantischen und nicht direkt technischen Ausrichtung.

"nice to have" ist sicher, wenn Filme und Musik auf einem zentralen Server liegen und für mehrere Leute im Netz verfügbar sind.

"easier to have" meint Daten, die man auch sowieso nochmal in Papierform hat und braucht, die aber so viel einfacher vom Server geladen werden können, wenn es zu Mailverkehr kommt. Dazu zähle ich etwa Zulassungen von KFZ, Versicherungs-Zertifikate und ähnliche Dokumente.

"must to have" sind für mich solche Daten, die ich gar nicht anders wieder erlangen könnte, weil sie rein auf dem PC gepflegt werden. Dazu zählt zB meine Steuererklärung, wobei die von meinem Finanzamt in einer eigenen Cloud gespeichert wird, so dass ich mich darum im Grunde nicht kümmern muss. Das soll nur ein Beispiel sein. Und ich erweitere dies dann sofort auf meine Mails: weil ich die nicht lange beim Provider liegen lasse, habe ich die Notwendigkeit, Kopien der lokalen Mailbox zu pflegen und das ist für mich ein "must to have", zumindest für die Postfächer, die wirklich wichtige Mails beinhalten.

Das grobe Kopieren ganzer Zpools ist natürlich eine Möglichkeit, Backups zu erstellen. Daran ist nichts verkehrt!
Durch meinen "Sortier-Prozess" schaffe ich in dem Daten-Wust eine gewisse Ordnung, die es für mich einfacher macht, Prioritäten zu setzen und danach unterschiedliche, angemessene Backup-Szenarien zu verwirklichen.
 
Bierglas umgeschmissen
Frische Tasse Kaffee ins Netbook, die nichtmal komplett reingepasst hat. :)

Diebstahl ist so was, das vollkommen außerhalb meiner Wahrnehmung liegt. Deshalb nenne ich auch Paranoia, wie sich die Kollegen verhalten. Die wohnen aber in Städten und erleben angeblich dauernd solche Szenarien. Ich wohne auf dem Land und hier haben die Leute tatsächlich die Türen noch nicht abgeschlossen.
Bin ebenfalls Kaffkind, aber die Einbrüche haben sich auch hier gehäuft.

Ich hoffe doch mal auf einen Einbruch und dumme Gesichter. In meiner Wohnung gibts Hardware, darauf hat Karajan schon geklimpert und genügend Asbest. :D

Bevor hier Ideen aufkommen: Ein Tellereisen in der Wohnung ist voraussichtlich als 'vorsätzliche Körperverletzung' auch einem Einbrecher gegenüber zu sehen. ;)
 
Bei so großen Datenmengen sollte man sich halt auch gedanken machen, wie man in den Backups sucht. Wenn du per Snapshots 20 Versionen hast und eine Datei, die "irgendwann im letzten Jahr noch dagewesen sein muss" suchst ohne genau zu wissen wo und wann, wird das ziemlich lustig auf 12TB. Wenn das ein mögliches Scenario für dich ist wäre vielleicht eine Backupsoftware die einen Index über die Datein in allen Snapshots hat eine gute Idee.

Ansonsten wurd ja schon angesprochen, dass ein externes Backup durchaus seine Vorteile hat, aber auch nicht alle Daten sind gleich wichtig. Von meinen ~3TB die intern auf externe Platten gebackupt werden landen bei mir nur ~600GB auch am externen Backup. Allerdings bin ich da nicht ganz so paranoid und pack das ganze verschlüsselt auf Amazon Glacier.
 
Ich hab das ganze mal vor einer Weile für mich durchgerechnet. Das Billigste ist weiterhin sich eine Festplatte zu holen, die an einen USB Adapter anzuschließen und dann die Daten zu übertragen. Ist dann natürlich auch etwas Arbeit, weil man kein einfaches Komplettbackup machen kann, aber dafür eben billiger. Außer man hängt eben per USB gleich mehrere Platten im Pool zusammen. Ist aber noch schlecht erweiterbar. Auch BluRays brennen ist wesentlich teurer, wenn man haltbare Rohlinge haben will.

Cloud-Dienste wollen halt monatlich Geld, (Dienste wie Amazon Glacier wollen sogar Geld für's Abrufen der Daten, Google Drive will 100€/Monat für 10TB) und bei den Preisen für Festplatten kann man sich dann schon quasi jeden Monat eine neue Platte holen. Nach einem Jahr hat man dann bereits so viel Backup-Platz inkl. Redundanz, dass sich das mit dem Holen von neuen Platten auch schon wieder erledigt hat.
 
Ein TB kostet auf Glacier im Monat 4 USD, das ist finde ich ganz günstig für ein gut gesichertes, regional verteiltes Backup.
Die Preise für den Abruf wären dabei bei ca 10 USD, aber das ist ja nur im Ernstfall, wenn das RAID + das lokale Backup versagen.
 
Ein großes Problem bei Cloud-Storage ist halt, dass die Daten da erstmal hinkommen müssen. In der Firma mit 1GBit/s synchron ist das kein allzu großes Problem, aber zu Hause über meinen DSL-Anschluss mit 10Mbit/s würde ich bei der Erstsynchronisation einen Nervenzusammenbruch bekommen. Dann lieber mit Bekannten eine verschlüsselte Platte austauschen. Hat auch den Vorteil, dass so eine Platte recht sicher vor dem Zugriff unserer hochkompetenten Strafverfolgungsbehörden ist und man sie im Falle des Falles nicht erst rausklagen muss.
 
Hat auch den Vorteil, dass so eine Platte recht sicher vor dem Zugriff unserer hochkompetenten Strafverfolgungsbehörden ist und man sie im Falle des Falles nicht erst rausklagen muss.

...und wenn man sie rausgeklagt hat, darf man zu Recht unsicher sein, ob man sie noch auslesen kann (geschüttelt und angestoßen, inadäquate Behandlung) oder ob man sie noch auslesen will (Daten inkonsistent, belastend zu Ungunsten des Besitzers modifiziert, mit Bundestrojaner angereichert).
 
- Ist das so eine brauchbare Idee?
Ich würde da eher sagen "Nein". Wenn du einen ZFS Pool so kopierst, hast du immer genau nur 1 Version von deinen Dateien. Du hast keine History dazu. Zweitens musst du immer den kompletten Pool zurück spielen. Einzelne Dateien kannst du nicht wiederherstellen (als wenn der Pool in eine Image Datei gesendet wurde). Drittens muss das Zielgerät mind. die gleiche Grösse haben, damit das überhaupt per send/receive funktioniert.

Ich würde persönlich eher in Richtung "Minio" und "Restic S3" schauen. Sprich per Minio baust du dir (auch aus mehreren HDD's) einen Storage Pool. Restic macht dir inkrementelle Backup (Daily 30, weekly 8, monthly 24 z.B.) und kopiert dir diese auf den Minio Pool, welchen du per Amazon S3 ansteuern kannst.

Kannst du diese 11 TB irgendwie splitten? So nach Dokumente 5GB, Bilder 8TB etc? Dann reichen dir auch verschiedene HDD's mit unterschiedlichen Grössen.

[1] https://min.io/product
[2] https://restic.readthedocs.io/en/latest/030_preparing_a_new_repo.html#amazon-s3
 
Zurück
Oben