FreeBSD 10@Hetzner verliert Netzwerk während Backup

Vektoren

Member
Guten Morgen liebes Forum :)

Ich habe leider ein ernstes Problem mit meinem FreeBSD 10 auf meinem Hetzner Server: Sobald ich meinen Backup-Prozess anwerfe, verliert das System die Netzwerk-Verbindung.

Fehler in den Logs (messages):
Code:
Jun  1 20:13:06 server kernel: re0: watchdog timeout
Jun  1 20:13:06 server kernel: re0: link state changed to DOWN
Jun  1 20:13:09 server kernel: re0: link state changed to UP
Jun  1 20:13:09 server devd: Executing '/etc/rc.d/dhclient quietstart re0'
Jun  1 20:25:26 server kernel: re0: watchdog timeout
Jun  1 20:25:26 server kernel: re0: link state changed to DOWN
Jun  1 20:25:29 server kernel: re0: link state changed to UP
Jun  1 20:25:29 server devd: Executing '/etc/rc.d/dhclient quietstart re0'
Jun  1 22:10:42 server kernel: re0: watchdog timeout
Jun  1 22:10:42 server kernel: re0: link state changed to DOWN
Jun  1 22:10:45 server kernel: re0: link state changed to UP
Jun  1 22:10:45 server devd: Executing '/etc/rc.d/dhclient quietstart re0'

Das wiederholt sich dann endlos, bis ich den Server von Hetzner per Reset-Signal neustarten lasse.

Der Prozess / Ablauf:
  1. Ich starte z.B. per Hand das Backup-Skript in einer Screen-Session
  2. Das Backup-Programm ruft aus dem Filesystem eine Liste aller Dateien ab, die gesichert werden sollen (keine Systemdateien).
  3. Das Backup-Programm erzeugt in Amazon S3 einen neuen Container.
  4. Das Backup-Programm öffnet jede Datei nacheinander (read-only) und streamt den Dateiinhalt in einen ZIP-Algorithmus und die ZIP-Bytes werden direkt in den Amazon S3-Container gestreamt. :)
  5. Etwa 15 Minuten nachdem das Streaming zu Amazon S3 beginnt, kommen obige Fehlermeldungen und der Server ist nicht mehr erreichbar! :(
  6. Natürlich bricht auch das Backup ab, weil er nicht mehr zu S3 streamen kann :(
Interessant ist: Ab und zu läuft das Backup dann doch mal durch und obiger Fehler kommt dann zeitversetzt Stunden später. :rolleyes:

Server- / FreeBSD-Konfiguration:
  • Das Netzwerk benutzt kein DHCP sondern eine statische Netzwerk-Konfiguration
  • Ich setze pf als Firewall und NAT ein (u.a. wg. Jails)
  • Server: Hetzner EX40

Fragen:
  • Was meint ihr dazu?
  • Kennt jemand dieses Problem?
  • Eher ein Hardware-Defekt der Netzwerkkarte oder kann das durch die Konfiguration (BIOS?) oder Firewall (pf) kommen?
  • Best Practices?

Viele Grüße,
Thorsten :)
 
Bei Problemen mit re Karten hilft bei mir am Besten besseres Kabel (z.B. CAT6 statt CAT5). Da das nicht Dein Netzwerk ist – Halb-Duplex erzwingen scheint auch zu funktionieren.
 
Hmmm... soweit schon mal danke :) Ich werde das testen, @Yamagi Leider konnte ich mein System bisher nicht von der neuen Netzwerk-Config überzeugen ;) Das System kommt mit der neuen Konfiguration nicht mehr hoch und ich muss wieder mit der alten Konfiguration starten.

Ich sehe den Wald vor lauter Bäumen nicht mehr :( Daher dokumentiere ich das jetzt mal fürs Forum und versuche es die Tage noch mal :)

Alt:
Code:
ifconfig_re0="1xx.xx.xxx.xxx netmask 255.255.255.224 broadcast 1xx.xx.xxx.xxx"
defaultrouter="1xx.xx.xxx.xxx"

ipv6_network_interfaces="re0"
ifconfig_re0_ipv6="inet6 xxxxxxxxxxxx::/64 prefixlen 64"
ipv6_defaultrouter="xxxx::1%re0"

Neu:
Code:
ifconfig_re0="1xx.xx.xxx.xxx netmask 255.255.255.224 broadcast 1xx.xx.xxx.xxx media 1000baseTX mediaopt full-duplex,flag0"
defaultrouter="1xx.xx.xxx.xxx"

ipv6_network_interfaces="re0"
ifconfig_re0_ipv6="inet6 xxxxxxxxxxxx::/64 prefixlen 64"
ipv6_defaultrouter="xxxx::1%re0"
 
Such mal in dem Hetzner Wiki nach der Netzwerkkonfiguration für FreeBSD, irgendwas war da ... :o
 
Du brauchst doch die Kiste nicht neu starten, wenn du die Netzwerkparameter änderst.
Versuch doch einfach mal, mit dem alten Setup folgenden Aufruf:

# ifconfig re0 1xx.xx.xxx.xxx netmask 255.255.255.224 broadcast 1xx.xx.xxx.xxx media 1000baseTX mediaopt full-duplex

Natürlich die X richtig ersetzen.
Wenn das klappt einfach so in der rc.conf übernehmen, ich denke nämlich, dass das ",flag0" da einfach zuviel ist.

Rob
 
@KobRheTilla Ja, ich weiß :) Ich hatte es zuerst auch ohne Neustart probiert, allerdings verliere ich dann sofort die Verbindung -- bringt mich also auch nicht wirklich weiter ;) Ohne "flag0" hatte ich ebenfalls schon, ohne Erfolg. :confused:
 
Bei mir steht da z.B.:
Code:
ifconfig_re0="inet 188.XXX.XXX.XXX/32"
ifconfig_re1="inet 192.XXX.XXX.XXX netmask 255.255.255.0"

#
# Routing-Konfiguration (Hetzner)
#
# Netzwerkkarte, ueber welche das Gateway erreicht wird
gateway_if="re0"
#
# MAC-Adresse des Gateways (wird fuer statisches ARP oder IPv6 benoetigt)
#gateway_mac="XX:XX:XX:XX:XX:XX"
#
# IPv4-Adresse des Gateways
gateway_ip4="188.XXX.XXX.XXX"
#
# IPv6-Adresse des Gateways (falls verwendet)
#gateway_ip6="xxxx:xxx:xxx:x::x"
#
# Routing (nicht aendern)
static_routes="gateway default"
route_gateway="-host $gateway_ip4 -interface $gateway_if"
route_default="default $gateway_ip4"
#
# Statisches ARP sollte nicht benoetigt werden
#static_arp_pairs="gateway"
#static_arp_gateway="$gateway_ip4 $gateway_mac pub"
#
# Falls IPv6 verwendet wird, die folgenden Zeilen auskommenieren
#static_ndp_pairs="gateway"
#static_ndp_gateway="$gateway_ip6 $gateway_mac"
#ipv6_defaultrouter="fe80::1%$gateway_if"

und dmesg sagt:
Code:
# grep re0 /var/run/dmesg.boot
re0: <RealTek 8168/8111 B/C/CP/D/DP/E/F PCIe Gigabit Ethernet> port 0xd800-0xd8ff mem 0xfbdff000-0xfbdfffff,0xf7ff0000-0xf7ffffff irq 16 at device 0.0 on pci6
re0: Using 1 MSI-X message
re0: Chip rev. 0x3c000000
re0: MAC rev. 0x00400000
miibus0: <MII bus> on re0
re0: Ethernet address: 00:24:21:e5:8d:10

HTH - ich glaube aber, daß dein Problem eher in etwas anderem zu suchen ist. Speichernutzung z.B. und dann läuft der voll und die Kiste schmiert ab.
 
Hallo alle zusammen.

Nun sind etwa 3 Monate ins Land gezogen und ich möchte euch meine Lösung mitteilen ;)

Weitere empirische Analysen haben meine Annahme gestärkt, dass entweder die Netzwerkanbindung meines Servers gestört oder die Netzwerkkarte mit dem FreeBSD-Treiber nicht korrekt zusammenarbeitet. Egal was letztlich zutrifft: Beides sind Faktoren, die sich meinem Einfluss entziehen und wo Hetzner nichts ändern würde (z.B. wegen dem Netzwerk => andere Betriebssysteme kommen halt mit der nicht-idealen Anbindung klar, warum sollte Hetzner also eingreifen?) Daher war die tatsächliche Ursache nicht relevant, da jede der noch möglichen Ursachen für mich keine Basis für ein professionelles System dargestellt hätte, auf das ich mich täglich verlassen können muss :cool:

Meine Lösung!
Die Konsequenz: Ein neuer Hoster musste her! :( Die großen Deutschen habe ich inzwischen alle durch, jeder mit seinen Stärken und Schwächen: Die jeweiligen Schwächen haben mich davon abgehalten, dort einen FreeBSD-Server einzurichten. Nach einiger Recherche bin ich jetzt bei Webtropia gelandet. Was ich an der Stelle noch erwähnen sollte: Man findet zu jedem Hoster negative wie positive Berichte im Netz. Meine Erfahrung der letzten 20 Jahre haben gezeigt: Man kann und sollte Hostern immer mal wieder eine Chance geben, weil sie sich natürlich auch weiterentwickeln. Zudem müssen negative wie positive Berichte kritisch beurteilt werden: Hatte z.B. der Autor des Berichts überhaupt die notwendige IT-Kompetenz oder sind es überwiegend semi-professionelle Amateure, welche die Berichte verfassen?

Wie dem auch sei: Am Ende stand ich bei Webtropia: Dort habe ich einen HP Proliant SL230s Gen8-Server für das FreeBSD 10 eingerichtet. Die Netzwerkanbindung ist stabil und die Treiber für die HP-Netzwerkkarte laufen auch einwandfrei. Der Server kostet zwar doppelt so viel wie der von Hetzner, aber er bietet auch eine ganz andere Qualität (Stichwort: mein eigenes iLO, HP Hardware-RAID, Firmware-Updates mit Changelogs, mehrere IP-Adressen im Preis enthalten, etc.) Der Support ist ebenfalls sehr nett, hilfsbereit und reagiert schnell. Ich habe den Eindruck, dass bei Webtropia noch Menschen arbeiten und dort kein 100 % vollautomatisiertes Rechenzentrum läuft (den Eindruck habe ich z.B. bei Strato, was im Fehlerfall zu ernsten Problemen führt, falls du ein Problem hast, das nicht mit den vollautomatisierten Notfallplänen abgedeckt wird).

Alternative VMWare vSphere / ESXi?
Als alternative Lösung hatte ich in den drei Monaten auch ein VMWare vSphere bzw. VMWare ESXi-System getestet. Vorteil hier: Die FreeBSD-Treiber müssen "nur" mit der idealen virtuellen Hardware zurechtkommen, was deutlich problemloser ablaufen sollte und zudem wäre auch das Netzwerk im ersten Segment virtuell. Allerdings muss ich gestehen: Wer einmal FreeBSD 10 auf Bare Metal (direkt auf der echten Maschine) laufen hatten, und dann die Performance mit einem virtuellen Server vergleicht... Naja: Bare Metal ist einfach eine ganze Ecke schneller.

Zudem sind VMWare und FreeBSD nicht unbedingt beste Freunde (Stichwort: VMWare Tools) und letztlich ist (a) die Lizenz-Politik von VMWare für kleine Unternehmen problematisch (z.B. das Load-Balancing-Plugin gibt es erst ab 5.000 Euro, was ich aber mit Jails & nginx & pf problemlos einrichten kann) und (b) ist selbst die Produkt-Entwicklung und -Politik inzwischen für mich nicht mehr tragbar: Wer die neuen Funktionen von ESXi nutzen will, muss die neue Web-Oberfläche nutzen, weil der vSphere-Client nicht mehr weiterentwickelt wird. Doch um die Web-Oberfläche nutzen zu können, muss man einen extra Windows-Server (ggf. auch als VM) einrichten, der aber mindestens 10 GB RAM erfordert. Das hätte in meinem Fall bedeutet, dass permanent 12 GM RAM (von 32 GB verfügbaren RAM) belegt gewesen wären, nur für die Infrastruktur! Davon abgesehen, dass neben einer ca. 500 Euro VMWare vSphere-Lizenz auch noch eine ca. 500 Euro Windows Server-Lizenz erforderlich wäre.

So, damit ist meine Lösung und sind meine Überlegungen dokumentiert und archiviert. Vielleicht hilft es eines Tages jemanden :) Ich bedanke mich noch einmal für eurer Bemühen um mein initiales Problem zu lösen :) Der positive Aspekt an dem Ganzen: Ich habe jetzt ein sehr umfangreiches Setup-Skript für meine FreeBSD 10-Umgebung :D


Viele Grüße,
Thorsten.
 
Hallo :)

Zudem sind VMWare und FreeBSD nicht unbedingt beste Freunde (Stichwort: VMWare Tools)
Hast du folgendes schon versucht? emulators/open-vm-tools-nox11
The Open Virtual Machine Tools (open-vm-tools) are the open source implementation of VMware Tools. They are a set of guest operating system virtualization components that enhance performance and user experience of virtual machines. As virtualization technology rapidly becomes mainstream, each virtualization solution provider implements their own set of tools and utilities to supplement the guest virtual machine. However, most of the implementations are proprietary and are tied to a specific virtualization platform.
Damit habe ich zwei PKG Buildserver am laufen. 8 Cores mit 8GB RAM. Baut so um die 150 Pakete in 12min. Hatte noch nie Probleme damit.

Wer die neuen Funktionen von ESXi nutzen will, muss die neue Web-Oberfläche nutzen, weil der vSphere-Client nicht mehr weiterentwickelt wird.
Der war ja leider nur für Windows. Der WebClient ist zwar langsamer aber dafür geht er auch unter Linux/MAC/*BSD.

Doch um die Web-Oberfläche nutzen zu können, muss man einen extra Windows-Server (ggf. auch als VM) einrichten, der aber mindestens 10 GB RAM erfordert.
Es gibt eine "VMware vCenter Server Appliance". Damit brauchst du kein Windows und 8GB sind "OK".

Ich habe jetzt ein sehr umfangreiches Setup-Skript für meine FreeBSD 10-Umgebung :D
Ist doch auch was! Und nebenher sicher noch etwas gelernt :)

Gruss
 
Hallo,

vielleicht wäre auch noch XEN Server interessant es ist gerade mit allen Funktionen (Cluster) und Managementtool von Citrix freigegeben worden.

Grüsse

Jörg
 
Nun sind etwa 3 Monate ins Land gezogen und ich möchte euch meine Lösung mitteilen ;)

Weitere empirische Analysen haben meine Annahme gestärkt, dass entweder die Netzwerkanbindung meines Servers gestört oder die Netzwerkkarte mit dem FreeBSD-Treiber nicht korrekt zusammenarbeitet. Egal was letztlich zutrifft: Beides sind Faktoren, die sich meinem Einfluss entziehen und wo Hetzner nichts ändern würde (z.B. wegen dem Netzwerk => andere Betriebssysteme kommen halt mit der nicht-idealen Anbindung klar, warum sollte Hetzner also eingreifen?) Daher war die tatsächliche Ursache nicht relevant, da jede der noch möglichen Ursachen für mich keine Basis für ein professionelles System dargestellt hätte, auf das ich mich täglich verlassen können muss :cool:

Meine Lösung!
Die Konsequenz: Ein neuer Hoster musste her!

Den Gaul zu erschießen, wenn er nicht läuft ist zwar auch eine Lösung, aber meiner Erfahrung nach hängen die sich bei Hetzner durchaus rein, wenn man sie davon überzeugt hat, daß es ein Problem gibt und das erkennen die z:B. an der Häufigkeit der auftretenden Probleme.

just my 2 cents
 
Zurück
Oben