Stabilitätsprobleme mit SCSI + *BSD?

Dr.Sweety

Fnord!
Mein Server hat sich jeweils nach ein paar Tagen Betrieb mit einem Kernel Error aufgehängt hat (unter FreeBSD 5.2-RC bis 5.2.1-RC2). Nach etwas herumprobieren habe ich entdeckt, dass die Ursache wohl bei meinem SCSI Raid liegen muss, denn sobald ich dieses etwas belaste (z.B. ports.tar.gz entpacken) hängt sich das System auf. Das wirklich merkwürdige an dieser Sache ist jedoch, dass dies mit verschiedenen Controllern und verschiedenen *BSD Varianten auftritt! Folgende Controller/*BSDs habe ich getestet:
  • Compaq Smart 2SL
  • Mylex 960PL (2 versch. Controller getestet)
  • Irgend ein älterer Buslogic Controller (kein RAID)
Betriebssysteme:
  • FreeBSD 5.2-RC - 5.2.1-RC2
  • FreeBSD 4.9
  • NetBSD 1.6.1

Logischerweise bereitete schon nur die Installation von *BSD grosse Mühe da dann ja recht viel auf die Disks geschrieben wird und sich daher das System immer mal wieder aufhängt. Übrigens liefen alle 3 Controller absolut stabil unter Windows 2000 und Linux 2.4, es sollte also kein Hardware Problem sein. Hat irgend jemand ähnliche Erfahrungen gemacht? Ich weiss, dass die Controller uralt sind aber irgendwie nervt es mich trotzdem :)

PS: Ich habe das ganze System in der Zwischenzeit auf eine 60GB IDE Platte verschoben und das System läuft auch bei heftiger Diskaktivität stabil.
PPS: Irgendwie habe ich die Vermutung, dass nur Schreiben Probleme macht. Mein tägliches Dump auf ein Bandlaufwerk lief jeweils ohne Probleme durch ...
 
Hallo Dr. Sweety,

das es Probleme mit NetBSD 1.6.1 und dem Compaq SMART 2SL gibt, kann ich aus eigener Erfahrung bestätigen. Zu den anderen Kombinationen kann ich nichts sagen.

Bei NetBSD 1.6.1, ebenso bei 1.6, 1.5.2 und 1.5.3 (habe die vier persönlich getestet), gab es immer einen Kernel-Panic, angeblich defekter Sektor. Das tauchte auch immer bei massiven Schreibzugriffen auf das RAID-Array auf. Hatte damals gegooglet und dabei festgestellt, das das Problem bekannt war. Hier ist der Fehler, der bei mir auftauchte.

Mich würde interessieren, ob speziell der Controller auch unter FreeBSD Zicken macht. Ich hatte schon mal überlegt, die Maschine auf FreeBSD umzurüsten, aber es wegen der Arbeit dann doch gelassen.

Gruß c.
 
@crotchmaster

Oha, dann bin ich wenigstens nicht alleine :) Also unter FreeBSD ist es ziemlich das selbe wie unter NetBSD (sehr wahrscheinlich der gleiche Treiber), Kernel Panics beim Installieren oder später bei Zugriff aud den RAID. Das sowohl unter 4.9 als auch unter 5.2 ... komischerweise gab es dann auch mit einem Mylex Problem und eben auch mit einem völlig normalen SCSI Controller (von Buslogic, ein BA80C30), daher auch meine Frage. FreeBSD wird dir daher wohl leider nichts bringen :(
 
Also ich habe 2 Mylex unter freeBSD 5.1 [frueher 4.9] am laufen - problemlos. Das einzige mir bekannte Problem ist das man mlx devices unter 5.2 nicht als dump device verwenden kann.

Nachtrag:
mlxcontrol ist auch noch nicht angepasst.
 
Zuletzt bearbeitet:
das wird euch nicht viel helfen, aber bei mir lauft jetzt seit 3 tagen freebsd 5.2 mit einem adaptec 39160 wunderbar und ich hab schon eine menge gelesen und geschrieben ...
 
also ich ärgere mich seit ein paar tagen mit der installation von 5.2.1 auf einen rechner mit ner Mylex DAC960.

Ich habe 5x4,5GB IBM Festplatten am Mylex und eine 4,3er am Onboard SCSI controller. Wenn ich das System auf die Festplatte installiere, die am onboard-controller hängt und den Mylex-Platten den Strom weg nehme, klappt alles wunderbar. Aber wenn die den Strom für die Mylexplatten wieder ran mache und das System auf das Mylex-RaidArray installiere, stürtz es immer bei installieren ab, und zwar immer dann wenn z.b. die ports auf die Platte kopiert werden.

Die Fehlermeldung ist irgendwas von accees to not allocated adress oder so. RAM habe ich schon mit memtest getestet. Könnte ansonsten nur noch der Strom sein, ich habe zwar ein 400W Netzteil drin, dass sollte doch reichen, oder??
 
na herrlich :-)

hast du nen link oder weitere infos? ob der treiber wirklich im Ar*** ist oder ob ich hier weiter rum probieren muss...
 
Leider nein. Ich dachte auf ner mailingliste was dazu gelesen zu haben.
Wie siehts denn bei 5.2 aus? Geht es damit?
 
hi!

also ich lese eigentlich immer current, stable und hackers. Da habe ich nichts gehört. Aber ich hatte das Ding vorher unter 5.1 am laufen, da konnte ich es wenigstens installieren :-)

Da gab es aber ab und zu ne panic, deshalb wollte ich upgraden und hatte noch eine festplatte mehr rumliegen, die ich auch noch einbauen wollte.

ich werde mal 5.1 probieren.

Danke
 
Wie gesagt, ich glaube das es so ist. Ich bin mir nicht 100% sicher.
Das kommt davon wenn der Input irgendwann zu gross wird....
 
FreeBSD-Current Mailinglist von eben:

>>>>>>>>>>>
OK, I seem to be able to get FreeBSD 5.2.1-RELEASE to reliably panic with
a "panic: free: address 0xd8d5e000(0xd8d5e000) has not been allocated." on
the serial console when it crashes.

I'm doing two copies of the entire ports collection to seperate
subdirectories when the crash occurs. It seems to do this regardless of

The machine is an IBM Netfinity 5500 with 4 x 550Mhz P3 Xeon CPUS, 2gigs
of ram and a Mylex DAC1100 RAID controller. There are 6 73G disks attached
to channel 0 of the controller, 5 disks are in a RAID 5 array, the sixth
is a hot spare.

Any ideas?



A 'trace' at the db> prompt yields:

cpuid = 2;
Debugger("panic")
Stopped at Debugger+0x55: xchgl %ebx,in_Debugger.0
db> trace
Debugger(c06d1f22,2,c06d07e3,e257dc30,100) at Debugger+0x55
panic(c06d07e3,d8d5e000,d8d5e000,0,c06d07a4) at panic+0x156
free(d8d5e000,c0705300,1,0,c0522975) at free+0xa3
mlx_enquire(c8277000,c,c,c04c3b60,d8) at mlx_enquire+0xef
mlx_periodic(c8277000,0,c06d2fed,d8,1) at mlx_periodic+0x174
softclock(0,0,c06cfc87,23a,c81d4a98) at softclock+0x1b8
ithread_loop(c42f1f00,e257dd48,c06cfaed,311,0) at ithread_loop+0x192
fork_exit(c0518350,c42f1f00,e257dd48) at fork_exit+0xb4
fork_trampoline() at fork_trampoline+0x8
--- trap 0x1, eip = 0, esp = 0xe257dd7c, ebp = 0 ---

>>>>>>>>>>

Ich bin also nicht allein :-) Aber das läßt hoffen, dass sich jemand schnell der Sache annimmt.
 
Hmm das mit dem Mylex ist interessant. Bei mir ist das System allerdings auch mit einem 4.9 Kernel abgestürzt. Von dem her gesehen stimmt wohl schon länger was nicht. Ich werde auf jeden Fall noch ein paar Tests durchführen, mal schauen ob ich den Fehler so nachvollziehen kann. Sonst bleibt wohl nichts anderes übrig als warten oder auf einen ATA-Raid umsteigen :( (Wäre auch nicht so schlimm, mein SCSI-RAID ist nicht mehr wirklich aktuell :D)
 
Wird auch nix helfen, aber ich bin vor geraumer Zeit von Mylex auf IBM ServRaid umgestiegen. Und obwohl der Treiber unter FreeBSD noch nicht fertig ist, läuft das System stabil. Nurso am Rande...
Gruß,
Alex
 
soooo, nach langem hin und her mit den Entwicklern, gibt es ab jetzt den passenden Patch in Current! Also mit einem Snapshot von in 10min sollte alles gehen.

juhu
 
Super, das muss ich in den nächsten paar Tagen mal testen... habe nämlich nicht wirklich Lust mein Gehäuse zu wechseln (wäre nötig gewesen wenn ich auf ATA Platten umsteigen müsste).

@Tomonage: hast du schon irgendwelche Erfahrungen mit den aktuellen Patches? Bei mir das System beim z.B. beim Entpacken von ports.tar.gz oder wie bei dir schon bei der Installation abgestürzt.
 
mein rechner läuft mit den patches super stabil, installieren/entpacken der ports klappt super. wichtig ist, dass du einen snapshot nach dem 3.3 erwischst, ab da sind die Änderungen drin.
 
si, bei mir geht mein mylex 960dac jetzt auch :)

vorher hatte ich schon beim install den gleichen crash ;D
 
Zurück
Oben