BSDForen.de  

Zurück   BSDForen.de > FreeBSD > FreeBSD - Allgemein

Antwort
 
Themen-Optionen Thema bewerten Ansicht
Alt 16.09.2012, 15:55   #1
unull
Nervensäge
 
Benutzerbild von unull
 
Registrierungsdatum: Feb 2005
Ort: ::1
Beiträge: 146
Hetzner Server instabil

Hallo Leute,

ich habe seit kurzem einen FreeBSD-Server bei Hetzner gemietet, auf dem momentan 9.1RC1 laeuft.

Seit ca. zwei Wochen tritt immer folgendes Szenario auf:

Wenn grosse Dateien per HTTP angefordert werden ist der Rechner kurz nicht zu erreichen, dann finde ich im Log folgendes:

Sep 16 14:47:46 achilles kernel: ahcich4: Timeout on slot 13 port 0
Sep 16 14:47:46 achilles kernel: ahcich4: is 00000000 cs 00002000 ss 00000000 rs 00002000 tfd c0 ser00000 cmd 0000cd17
Sep 16 14:47:46 achilles kernel: (ada0:ahcich4:0:0:0): WRITE_DMA48. ACB: 35 00 7d 40 10 40 53 00 00 01
Sep 16 14:47:46 achilles kernel: (ada0:ahcich4:0:0:0): CAM status: Command timeout
Sep 16 14:47:46 achilles kernel: (ada0:ahcich4:0:0:0): Retrying command

Mein ZFS-Pool wird dann auch immer gleich als "degraded" angezeigt, weil angeblich eine Platte fehlt. Neustarten ins Rescue-System hat zur Folge, dass beiden Platten nicht mehr auffindbar sind. Ich kann den Rechner in dem Zustand auch nicht per Strg+Alt+Entf via Robot neustarten. Lediglich ins Rescue-System komme ich.

Ich habe diesbezueglich auch schon mehrere Tickets an Hetzner geschrieben und dort um einen Hardware-Check gebeten. Bisher war jedesmal laut Hetzner nichts zu finden und nach dem Check hat der Rechner wird korrekt gebootet und lief eine Weile, bis diese seltsamen Lesefehler auftreten.

Ich denke, dass diese Fehler auch erst seit dem Update auf 9.1RC1 aufgetreten sind und die Kister vorher ca. zwei Monate problemlos durchlief.

Koennte das etwas anderes als ein Hardware-Problem sein? So langsam sind meine Moeglichkeiten bei Hetzner erschoepft, da saemtliche Hardware-Checks positiv verlaufen sind.

Bin fuer jeden Tipp dankbar.
unull ist offline   Mit Zitat antworten
Alt 16.09.2012, 16:19   #2
Yamagi
Possessed With Psi Powers
 
Benutzerbild von Yamagi
 
Registrierungsdatum: Apr 2004
Ort: Schleswig-Holstein
Beiträge: 6.552
Yamagi eine Nachricht über ICQ schicken
Setze mal 'hint.ahci.4.msi="1"' per /boot/loader.conf. MSI abzuschalten können Wunder wirken.
__________________
Eure Tastatur verfügt nicht umsonst über zwei Shift-Tasten! Benutzt sie bitte, denn sonst ist es mir fast unmöglich euere Posts zu entziffern.

Yamagi ist offline   Mit Zitat antworten
Alt 16.09.2012, 16:57   #3
Crest
rm -rf /*
 
Registrierungsdatum: Jun 2008
Ort: Bremen
Beiträge: 1.078
Das Rescuesystem hat soweit mir bekannt keinen ZFSv28 Support. Demnach kannst du den ZPool nicht in das Rescuesystem importiern.
Crest ist offline   Mit Zitat antworten
Alt 16.09.2012, 18:21   #4
unull
Nervensäge
 
Benutzerbild von unull
 
Registrierungsdatum: Feb 2005
Ort: ::1
Beiträge: 146
Zitat:
Zitat von Yamagi Beitrag anzeigen
Setze mal 'hint.ahci.4.msi="1"' per /boot/loader.conf. MSI abzuschalten können Wunder wirken.
Werde ich testen. Danke.
unull ist offline   Mit Zitat antworten
Alt 16.09.2012, 18:22   #5
unull
Nervensäge
 
Benutzerbild von unull
 
Registrierungsdatum: Feb 2005
Ort: ::1
Beiträge: 146
Zitat:
Zitat von Crest Beitrag anzeigen
Das Rescuesystem hat soweit mir bekannt keinen ZFSv28 Support. Demnach kannst du den ZPool nicht in das Rescuesystem importiern.
Ja, ist mir bekannt Ich meinte auch mit "ich kann im Rescue-System keine Platte finde", dass /dev/ad0a /dev/ad1a nicht auffindbar waren.
unull ist offline   Mit Zitat antworten
Alt 17.09.2012, 21:36   #6
unull
Nervensäge
 
Benutzerbild von unull
 
Registrierungsdatum: Feb 2005
Ort: ::1
Beiträge: 146
Hat leider nichts geholfen. Gestern abend alles wunderbar, heute abend ist der Rechner wieder im Zombie-Modus gelandet. Resetten hilft auch nichts mehr. Ich bin ratlos.
unull ist offline   Mit Zitat antworten
Alt 18.09.2012, 00:22   #7
Crest
rm -rf /*
 
Registrierungsdatum: Jun 2008
Ort: Bremen
Beiträge: 1.078
Welcher Typ Hetznerserver ist das? Ich haben einen EQ4 und einen EX4 stabil mit FreeBSD 8.3 bzw. 9.0 am laufen.
Crest ist offline   Mit Zitat antworten
Alt 18.09.2012, 15:34   #8
Bummibaer
Registered Schwarzbär
 
Benutzerbild von Bummibaer
 
Registrierungsdatum: Jan 2004
Ort: RZ Bärenhöhle Raum Stuttgart grob
Beiträge: 941
Hi,
Timeouts in diesem Zusammenhang mit FreeBSD 9.x habe ich auch schon öfter gesehen. In den meisten Fällen war hierbei eine SSD oder HD mit defekter Firmware die Ursache für die Timeouts. Danach kam regelmäßig der Kernelpanicbär zu Besuch. Ein Update der SSD / HD Firmware hat das Problem meistens gelöst.

Bei einer SSD im Test hier gibt es da noch nichts Neueres und das Problem tritt nach wie vor sporadisch auf.

Hier ein paar Eckdaten:

Code:
# cat /var/run/dmesg.boot|grep ahci ahci0: <Intel ICH9 AHCI SATA controller> port 0xa400-0xa407,0xac00-0xac03,0xa880-0xa887,0xa800-0xa803,0xa480-0xa49f mem 0xfe777000-0xfe7777ff irq 19 at device 31.2 on pci0 ahci0: AHCI v1.20 with 6 3Gbps ports, Port Multiplier not supported ahcich0: <AHCI channel> at channel 0 on ahci0 ahcich1: <AHCI channel> at channel 1 on ahci0 ahcich2: <AHCI channel> at channel 2 on ahci0 ahcich3: <AHCI channel> at channel 3 on ahci0 ahcich4: <AHCI channel> at channel 4 on ahci0 ahcich5: <AHCI channel> at channel 5 on ahci0 ada0 at ahcich0 bus 0 scbus0 target 0 lun 0 # cat /var/run/dmesg.boot | grep ada0 ada0 at ahcich0 bus 0 scbus0 target 0 lun 0 ada0: uhub5: 2 ports with 2 removable, self powered ada0: 300.000MB/s transfers (SATA 2.x, UDMA6, PIO 8192bytes) ada0: Command Queueing enabled ada0: 57241MB (117231408 512 byte sectors: 16H 63S/T 16383C) ada0: Previously was known as ad4 # camcontrol identify ada0 pass0: <MKNSSDCR60GB-DX 320ABBF0> ATA-8 SATA 3.x device pass0: 300.000MB/s transfers (SATA 2.x, UDMA6, PIO 8192bytes) protocol ATA/ATAPI-8 SATA 3.x device model MKNSSDCR60GB-DX firmware revision 320ABBF0 serial number MKN1139A00000247xx WWN 0000120000000000 cylinders 16383 heads 16 sectors/track 63 sector size logical 512, physical 512, offset 0 LBA supported 117231408 sectors LBA48 supported 117231408 sectors PIO supported PIO4 DMA supported WDMA2 UDMA6 media RPM non-rotating Feature Support Enabled Value Vendor read ahead yes yes write cache yes yes flush cache yes yes overlap no Tagged Command Queuing (TCQ) no no Native Command Queuing (NCQ) yes 32 tags SMART yes yes microcode download yes yes security yes no power management yes yes advanced power management yes no 254/0xFE automatic acoustic management no no media status notification no no power-up in Standby yes no write-read-verify yes no 0/0x0 unload yes yes free-fall no no data set management (TRIM) yes
Schau also am Besten erstmal ob die Firmware der HD bzw. SSD aktuell ist und ob die Einstellungen der Platte bzw. SSD für das was Du damit treibst ok sind (z.B. Power Management und solche Scherze).

Beste Grüße
Bummibär
__________________
- Bärenmitglied des Ordens des Heiligen Huthes _/\_

Running FreeBSD 8.x, FreeBSD 9.x, Bummi-OS 9.1-PRERELEASE

Geändert von Bummibaer (18.09.2012 um 15:50 Uhr).
Bummibaer ist gerade online   Mit Zitat antworten
Alt 18.09.2012, 17:41   #9
unull
Nervensäge
 
Benutzerbild von unull
 
Registrierungsdatum: Feb 2005
Ort: ::1
Beiträge: 146
Zitat:
Zitat von Crest Beitrag anzeigen
Welcher Typ Hetznerserver ist das? Ich haben einen EQ4 und einen EX4 stabil mit FreeBSD 8.3 bzw. 9.0 am laufen.
Es ist ein EX5.
unull ist offline   Mit Zitat antworten
Alt 18.09.2012, 20:38   #10
peterle
Forenkasper
 
Registrierungsdatum: Aug 2006
Ort: Aachen
Beiträge: 702
Zitat:
Zitat von unull Beitrag anzeigen
...
Neustarten ins Rescue-System hat zur Folge, dass beiden Platten nicht mehr auffindbar sind.
Das Rescuesystem findet die nicht mehr?
Was passiert mit anderen Rescuesystemen? Linux?

Zitat:
Ich kann den Rechner in dem Zustand auch nicht per Strg+Alt+Entf via Robot neustarten.
Lediglich ins Rescue-System komme ich.
Wie startest Du ihn denn dann neu?
Per Hardware-Reset oder muß einer gegen die Kiste treten gehen?
__________________
grüße
peterle

---
Ich habe einen IQ unterhalb einer Kartoffel. Ich wusste nicht, dass man zum hier schreiben einen IQ oberhalb einer Kartoffel haben muss.
[Jana Heinze am 20.06.2002 in dspm]
peterle ist offline   Mit Zitat antworten
Alt 18.09.2012, 21:12   #11
Yamagi
Possessed With Psi Powers
 
Benutzerbild von Yamagi
 
Registrierungsdatum: Apr 2004
Ort: Schleswig-Holstein
Beiträge: 6.552
Yamagi eine Nachricht über ICQ schicken
Bummibär bringt micht auf eine Idee. Lange Zeit verbaute Hetzner ja den guten Intel X57-Chipsatz in Kombination mit noch besseren Samsung-Platten. Die Kombination war sowas von inkompatibel, dass explodierte unter FreeBSD schon beim schief anschauen. Der einzige Ausweg war, dass seit 9.0 nun als Standard gesetzte ATACAM abzuschalten und auf ATA zu setzen. Alternativ konnte man seinen Kernel patchen, damit NCQ nicht genutzt wird. Lange Rede, kurzer Sinn: Schaue mal, ob du eine solche Kombination hast. Dann sehen wir weiter. Dazu gibt es auch einen PR (der nicht gefixt werden wird, da es ein Hardwareprob ist) - http://www.freebsd.org/cgi/query-pr.cgi?pr=157397

Edit: Eine aktuelle Version des Patches gibt es hier - http://lists.freebsd.org/pipermail/f...ry/066170.html
__________________
Eure Tastatur verfügt nicht umsonst über zwei Shift-Tasten! Benutzt sie bitte, denn sonst ist es mir fast unmöglich euere Posts zu entziffern.

Yamagi ist offline   Mit Zitat antworten
Alt 18.09.2012, 23:30   #12
Bummibaer
Registered Schwarzbär
 
Benutzerbild von Bummibaer
 
Registrierungsdatum: Jan 2004
Ort: RZ Bärenhöhle Raum Stuttgart grob
Beiträge: 941
Hi,

das Rescue System kannst du in die Tonne dort treten, da es 1. leider nicht aktuell genug ist und 2. wichtige Bestandteile für solche sinnvollen Aktionen (z.B. div. Kernel Module) schlicht vollständig fehlen. Wissen tut das der Anbieter schon seit mindestens einem 3/4 Jahr - reagieren leider nicht wirklich. Schlag dem Support einfach per Mail vor eine seiner zig hunderte von Kunden teuer bezahlten FreeBSD 9 amd64 DVD einzulegen und boote einfach davon. Dann stehen dir aktuelle ZFS und sonstige Tools und Kernel Module zur Verfügung.

Beste Grüße
Bummibär
__________________
- Bärenmitglied des Ordens des Heiligen Huthes _/\_

Running FreeBSD 8.x, FreeBSD 9.x, Bummi-OS 9.1-PRERELEASE
Bummibaer ist gerade online   Mit Zitat antworten
Alt 21.09.2012, 16:24   #13
unull
Nervensäge
 
Benutzerbild von unull
 
Registrierungsdatum: Feb 2005
Ort: ::1
Beiträge: 146
Zitat:
Zitat von Yamagi Beitrag anzeigen
Bummibär bringt micht auf eine Idee. Lange Zeit verbaute Hetzner ja den guten Intel X57-Chipsatz in Kombination mit noch besseren Samsung-Platten. Die Kombination war sowas von inkompatibel, dass explodierte unter FreeBSD schon beim schief anschauen. Der einzige Ausweg war, dass seit 9.0 nun als Standard gesetzte ATACAM abzuschalten und auf ATA zu setzen. Alternativ konnte man seinen Kernel patchen, damit NCQ nicht genutzt wird. Lange Rede, kurzer Sinn: Schaue mal, ob du eine solche Kombination hast. Dann sehen wir weiter. Dazu gibt es auch einen PR (der nicht gefixt werden wird, da es ein Hardwareprob ist) -
Soweit ich das im Linux-Rescue-System nachvollziehen kann, hat die Kiste ein MSI X58 Pro-E Mainboard mit diesem Chipsatz: "Intel® X58+ICH10R".

Scheint also damit auch aufzutreten oder das Problem ist ein anderes.

Die Symptome sind bei mir aber indentisch. I/O-Last und der Rechner geht in den Zombie-Modus. Neustarten ins Rescue-System geht per Hardware-Reset, aber FreeBSD bootet erst nach einem Hardware-Check (ich vermute, dass dabei der Rechner wohl mal ausgeschalten wird, wie in dem Post auf der Mailingliste beschrieben).
unull ist offline   Mit Zitat antworten
Alt 21.09.2012, 16:33   #14
unull
Nervensäge
 
Benutzerbild von unull
 
Registrierungsdatum: Feb 2005
Ort: ::1
Beiträge: 146
Zitat:
Zitat von peterle Beitrag anzeigen
\
Was passiert mit anderen Rescuesystemen? Linux?
Da werden beide Festplatten erkannt

Zitat:
Wie startest Du ihn denn dann neu?
Per Hardware-Reset oder muß einer gegen die Kiste treten gehen?
Hardware-Reset klappt. Ich kann damit zwar immer ins Rescue-System booten, aber FreeBSD bootet nicht.
unull ist offline   Mit Zitat antworten
Alt 22.09.2012, 21:42   #15
unull
Nervensäge
 
Benutzerbild von unull
 
Registrierungsdatum: Feb 2005
Ort: ::1
Beiträge: 146
Zitat:
Zitat von Yamagi Beitrag anzeigen
Der einzige Ausweg war, dass seit 9.0 nun als Standard gesetzte ATACAM abzuschalten und auf ATA zu setzen.
Aus aktuellem Anlass (heute ist wieder mal eine Platte verschwunden im laufenden Betrieb): Wie schalte ich ATACAM ab? Muss ich dafuer den Kernel neubauen?

Aendern sich da meine Device-Namen oder muss ich sonst nochwas beachten?
unull ist offline   Mit Zitat antworten
Antwort


Dieses Thema betrachten zurzeit 1 Personen. (0 registrierte Benutzer und 1 Gäste)
 
Themen-Optionen
Ansicht Thema bewerten
Thema bewerten:

Forumregeln
Es ist Ihnen nicht erlaubt, neue Themen zu verfassen.
Es ist Ihnen nicht erlaubt, auf Beiträge zu antworten.
Es ist Ihnen nicht erlaubt, Anhänge hochzuladen.
Es ist Ihnen nicht erlaubt, Ihre Beiträge zu bearbeiten.

BB-Code ist An.
Smileys sind An
[IMG] Code ist An
HTML-Code ist Aus
Gehe zu

Ähnliche Themen
Thema Erstellt von Forum Antworten Letzter Beitrag
Apache/php5 und VirtualHost(s) wollen nicht. zyon OpenBSD - Pakete und Anwendungen 14 21.10.2009 22:32
CGI laesst sich nicht ausfuehren - Error 500 oddateee OpenBSD - Pakete und Anwendungen 2 09.05.2007 18:07
Bad Request oddateee OpenBSD - Allgemein 14 09.07.2006 20:38
PHP4 geht mit SSL nicht klhesc FreeBSD - Allgemein 7 30.04.2006 19:42
apache für dummies ladli FreeBSD - Netzwerk 9 10.12.2004 20:04


Alle Zeitangaben in WEZ +1. Es ist jetzt 21:29 Uhr.


Powered by vBulletin (Deutsch)
Copyright ©2000 - 2013, Jelsoft Enterprises Ltd.