Performance von `zfs send`

h^2 · 4 Mai 2023

Ich mache regelmäßig Backups über das Internet mittels zfs send -R -I ... | ssh ... zfs recv -s -F -v.
Das funktioniert auch super. Aber es ist nicht sehr schnell; im Durchschnitt kriege ich so 3MB/s, möglich wären auf der Verbindung aber mehr als 10MB/s. Weder auf Sender noch auf Receiver sind die CPUs ausgelastet, also was ist hier der limitierende Faktor?

turrican · 4 Mai 2023

Im LAN ist zfs send/recv über ssh bei mir langsamer als ne Dateiübertragung per NFS oder iSCSI, aber nicht wesentlich.
So 70-80 MB/s statt 90 - 110.
Kannst du testweise eine große Datei über ssh/scp ans gleiche Ziel senden, zum Vergleich?

mr44er · 5 Mai 2023

Ist ein VPN dazwischen? Es gibt noch den -c Schalter:

Generate a more compact stream by using compressed WRITE records for blocks which are compressed on disk and in memory (see the compression property for details). If the lz4_compress feature is active on the sending system, then the receiving system must have that feature enabled as well. If the large_blocks feature is enabled on the sending system but the -L option is not supplied in conjunction with -c, then the data will be decompressed before sending so it can be split into smaller block sizes. Streams sent with -c will not have their data recompressed on the receiver side using -o compress= value. The data will stay compressed as it was from the sender. The new compression property will be set for future data. Note that uncompressed data from the sender will still attempt to compress on the receiver, unless you specify -o compress= off.

bsd4me · 5 Mai 2023

Ich denke, dass es am Netzwerk liegt. Ich habe 2 Server, die jeweils einen "Spiegel" / Backup haben - und das Backup habe ich mit zfs send / zfs recv gemacht. Da wird immer die volle Brandbreite von 100 MB/sec ausgenutzt... Es sei den das (inkrementelle) Backup ist an einem Tag nur sehr klein...

CommanderZed · 5 Mai 2023

Was liegt denn so "dazwischen"?

Ich hab zb immer mal wieder komische Sachen bei meinem privaten Anbieter gehabt da er Carrier-Grade-Nat macht, da war manchmal die ipv6 verbindung ohne selbiges stabiler, zb bei SSH verbindungen.

In diese Richtung (ipv4 vs v6, MTU, Packetfilter etc) würde ich evtl. mal schauen sofern das übers "öffentliche" Internet geht.

Yamagi · 6 Mai 2023

Und bedenkt, dass das SSH-Protokoll nie für Datenübertragungen gedacht war. Im LAN gehts meist noch, aber sobald höhere Latenzen ins Spiel kommen, macht es keinen Spaß mehr.

h^2 · 7 Mai 2023

Danke für das Feedback!

turrican schrieb:
Kannst du testweise eine große Datei über ssh/scp ans gleiche Ziel senden, zum Vergleich?

Also, wenn ich eine 1GB-Datei mit Zufallszahlen durch SSH ans Ziel `cat`e, dann kriege ich zumindest 7.8MB/s statt 3MB/s. Insofern ist SSH nicht das Hauptproblem, bzw. müsste auch mit SSH insgesamt mehr drin sein.

mr44er schrieb:
Es gibt noch den -c Schalter

Interessant, das gucke ich mir mal an. Ich bin immer davon ausgegangen, dass er komprimiert schickt, aber das ist ja dann wohl nicht default. Trotzdem müsste ich ja eigentlich mehr CPU-Load sehen wenn das der Bottleneck ist...

bsd4me schrieb:
Da wird immer die volle Brandbreite von 100 MB/sec ausgenutzt...

Hm, das sugerriert ja, dass es nicht an ZFS liegt. Ich probiere mal etwas rum, wenn ich die Zeit finde.

mr44er · 7 Mai 2023

ZFS per se wird da auch nicht das Problem sein, das rennt auf zu vielen Büchsen und wäre eher aufgefallen. Ein Flaschenhals wäre ein VPN (bisher nicht beantwortet

), vor allem wenn nur eines der beiden Routerchen eher schwachbrüstig ist, kein AES-NI hat und dann selber nochmal komprimiert. Das gäbe nochmal Latenzen on top.

h^2 schrieb:
Trotzdem müsste ich ja eigentlich mehr CPU-Load sehen wenn das der Bottleneck ist...

WENN der bottleneck auf dem Router geschieht, siehst du ihn natürlich nicht auf der anderen Maschine.

h^2 schrieb:
Ich bin immer davon ausgegangen, dass er komprimiert schickt, aber das ist ja dann wohl nicht default.

Ist nicht default, da nicht unbedingt die gleichen Settings für Kompression beim Empfänger gewährleistet sind, die es ermöglichen wegzuschreiben, ohne dass die Blöcke erneut angefasst werden müssen. Die ähnliche 'Problematik' kommt auch bei nativ verschlüsselten datasets vor, wenn man nicht aufpasst. Wenn nämlich das entsperrte dataset geZFS-send-et wird und man --raw nicht setzt, wird unverschlüsselt zum Ziel übertragen. Guter, ausführlicher Artikel dazu: https://arstechnica.com/gadgets/2021/06/a-quick-start-guide-to-openzfs-native-encryption/

netcat eignet sich besser zum Übertragen, das muss selber auch keine Verschlüsselung können, dann aber entweder über VPN und wenn nicht, sendest du ein nativ verschlüsseltes dataset mit --raw rüber und bist auf der sicheren Seite.

Bonuspunkte für pv, damit sieht man dann auch, wie schnell es gerade schaufelt.
Anregung:

Fast ZFS Send with Netcat

The general way to send ZFS data sets to remote nodes is normally achieved by sending the ZFS stream through ssh. Example: zfs send zones/UUID@snapshot | ssh root@10.10.11.5 zfs recv zones/UUID T…

blog.yucas.net

Fehler beim senden eines zfs snapshorts

Hallo Leute, ich habe mir vor Jahren ein Script geschrieben, das snapshots anlegt und diese dann per netcat übertrage. Das lief reibunslos. Leider gab es ein Problem. Da hatte ich den neuesten, lokalen snapshot gelöscht/destroyed in der Hoffnung, dass dann alles wieder okay ist, weil dann zfs...

www.bsdforen.de

FreshPorts -- sysutils/pv: Pipe throughput monitor

Pipe Viewer (pv) is a terminal-based tool for monitoring the progress of data through a pipeline. It can be inserted into any normal pipeline between two processes to give a visual indication of how quickly data is passing through, how long it has taken, how near to completion it is, and an...

www.freshports.org

cla · 8 Mai 2023

Vielleicht hilft es, den Transfer durch mbuffer zu schicken?

zfs send on FreeBSD over ssh using mbuffer – Dan Langille's Other Diary

h^2 · 10 Mai 2023

mr44er schrieb:
Ein Flaschenhals wäre ein VPN (bisher nicht beantwortet )

Kein VPN kommt zum Einsatz.

mr44er schrieb:
Die ähnliche 'Problematik' kommt auch bei nativ verschlüsselten datasets vor

Ja, das wird für mich auch irgendwann interessant. Momentan aber noch alles mit GELI.

mr44er schrieb:
Bonuspunkte für pv, damit sieht man dann auch, wie schnell es gerade schaufelt.

Jepp, das kommt eh zum Einsatz

cla schrieb:
Vielleicht hilft es, den Transfer durch mbuffer zu schicken?

Das sieht sehr interessant aus, das versuche ich auf jeden Fall beim nächsten Mal. Es scheint nämlich so, als ob die Übertragungsrate sehr stark schwankt. Vielleicht kriege ich damit eine dauerhaft höhere hin.

mr44er · 10 Mai 2023

h^2 schrieb:
Es scheint nämlich so, als ob die Übertragungsrate sehr stark schwankt.

Das habe ich auch beobachtet, Schwankungen zwischen 10%-100%, egal ob im LAN oder via VPN durchs Internet. Mit Blick auf gstat und die Blinkintervalle der Platten-LEDs kam ich zum Schluß, dass der Sender drosselt, wenn das Ziel etwas länger zum Wegschreiben braucht. Im Schnitt landet es dann aber trotzdem beim nettomax, das die jeweilige Leitung im upload schafft.
Hast du mal die benötigte Zeit grob zur Datenmenge gegengerechnet? Nicht, dass man sich enttäuscht von den gerade angezeigten Werten ablenken lässt...

goblin · 12 Mai 2023

Ich sende immer durch mbuffer auf beiden Seiten, inspiriert von Dan Langille.
Damit bin ich bisher ganz gut gefahren und habe deutlich höhere Übertragungsgeschwindigkeiten als ohne.

h^2 · 24 Mai 2023

Ich habe jetzt mal einen run mit mbuffer angeworfen.
Das Verhalten ist aber anders als erwartet. Ich hatte gedacht es läuft so:

Source kopiert Daten in den source-Buffer.
Wenn Source-Buffer voll (1GB), wird er durchs Internet geschickt
Sink-Buffer wird gefüllt
Wenn Sink-Buffer voll (1GB), wird er auf Platte des Ziel-Systems gedumpt

Das scheint aber nicht der Fall zu sein. Ich habe permanent reads auf dem Source-System und permanent writes auf dem Ziel-System. Die Ausgabe von mbuffer auf dem Ziel-System alterniert jede Sekunde zwischen 0% full und 100% full :confused:

Andy_m4 · 2 Juni 2023

h^2 schrieb:
Ich hatte gedacht es läuft so:
....

Generell sind ja Buffer vor allem dafür da, die Übertragungsgeschwindigkeit zu "glätten". Damit zum Beispiel die "Verschick-Routine" nicht auf die Platten warten muss, nur weil Du da gerade Lesekopfbewegung drin hast.
Insofern sind permantente Reads und permanente Write sogar völlig normal.

h^2 schrieb:
... alterniert jede Sekunde zwischen ...

Normalerweise hätte ich gesagt, der Buffer ist zu klein gewählt. Aber bei 1GB wird das wohl eher nicht die Ursache sein. Und man weiß ja auch nicht, wie verlässlich diese Ausgaben sind.
Die zentrale Frage ist eher: ändert sich was an der Übertragungsgeschwindigkeit?

Performance von `zfs send`

h^2

hat ne Keule +1

turrican

Well-Known Member

mr44er

moderater Moderator

bsd4me

Well-Known Member

CommanderZed

OpenBSD User

Yamagi

Possessed With Psi Powers

h^2

hat ne Keule +1

mr44er

moderater Moderator

Fast ZFS Send with Netcat

Fehler beim senden eines zfs snapshorts

FreshPorts -- sysutils/pv: Pipe throughput monitor

cla

Well-Known Member

h^2

hat ne Keule +1

mr44er

moderater Moderator

goblin

Motivierter Amateur

h^2

hat ne Keule +1

Andy_m4

Well-Known Member

Wir schützen deine Privatsphäre