cam status: uncorrectable parity/CRC error

H

holgerw

Guest
Hallo,

über eSATA habe ich eine externe 500 GB Platte an mein Notebook angeschlossen, drei Partitionen samt zpool erstellt, und darauf ein FreeBSD 11.1 installiert.

Wenn ich FreeBSD von externer Platte boote, und zwischen interner Platte (auch mit zpool und FreeBSD-Installation) und externer Platte Datan kopiere, hagelt es folgende Fehler:
Code:
cam status: uncorrectable parity/CRC error
Dabei wird immer ata1 als betroffene Platte gemeldet, also die externe.

Das Kabel habe ich schon getauscht, die Fehlermeldungen bleiben.

Wenn ich hingegen das intern installierte FreeBSD boote, und dann Daten zwischen interner Platte und externer Platte kopiere, ist alles in Ordnung, an dem Kabel, den Schnittstellen und der externen Platte kann es wohl nicht liegen.

Woran aber dann? Mag die externe eSATA vielleicht keine Kompression des Datasets, auf welchem FreeBSD installiert ist?

Ich habe nun erstmal das Dataset mit der FreeBSD-Installation von der externen Festplatte gelöscht und möchte das nochmal aufsetzen.

Aber vielleicht hat jemand eine Idee, woran so etwas liegen kann.
 
Nachtrag: Wenn ich vom Installationsstick boote und den zpool der externen Platte importiere, kommen sofort die Fehler.

Wenn ich vom installierten FreeBSD auf der internen Platte boote, und dann den zpool der externen Platte importiere, ist alles in Ordnung.
 
Hallo Rob,

bin gerade nicht am Notebook, habe ich schon gemacht und keine Fehler entdeckt (sofern ich diese Menge an Output richtig verstanden habe). Das Resultat kann ich hier später noch mal posten.
 
Hallo,

hier kommt die Ausgabe:
Code:
[root@elch /usr/home/holger]# /usr/local/sbin/smartctl -a /dev/ada1
smartctl 6.5 2016-05-07 r4318 [FreeBSD 11.1-RELEASE amd64] (local build)
Copyright (C) 2002-16, Bruce Allen, Christian Franke, www.smartmontools.org

=== START OF INFORMATION SECTION ===
Model Family:     SAMSUNG SpinPoint F3
Device Model:     SAMSUNG HD502HJ
Serial Number:    S20BJ1KSB03826
LU WWN Device Id: 5 0024e9 0026475a0
Firmware Version: 1AJ100E4
User Capacity:    500.107.862.016 bytes [500 GB]
Sector Size:      512 bytes logical/physical
Rotation Rate:    7200 rpm
Form Factor:      3.5 inches
Device is:        In smartctl database [for details use: -P show]
ATA Version is:   ATA8-ACS T13/1699-D revision 6
SATA Version is:  SATA 2.6, 3.0 Gb/s
Local Time is:    Fri Aug 11 06:07:29 2017 CEST
SMART support is: Available - device has SMART capability.
SMART support is: Enabled

=== START OF READ SMART DATA SECTION ===
SMART overall-health self-assessment test result: PASSED

General SMART Values:
Offline data collection status:  (0x00) Offline data collection activity
                                        was never started.
                                        Auto Offline Data Collection: Disabled.
Self-test execution status:      (   0) The previous self-test routine completed
                                        without error or no self-test has ever
                                        been run.
Total time to complete Offline
data collection:                ( 4800) seconds.
Offline data collection
capabilities:                    (0x5b) SMART execute Offline immediate.
                                        Auto Offline data collection on/off support.
                                        Suspend Offline collection upon new
                                        command.
                                        Offline surface scan supported.
                                        Self-test supported.
                                        No Conveyance Self-test supported.
                                        Selective Self-test supported.
SMART capabilities:            (0x0003) Saves SMART data before entering
                                        power-saving mode.
                                        Supports SMART auto save timer.
Error logging capability:        (0x01) Error logging supported.
                                        General Purpose Logging supported.
Short self-test routine
recommended polling time:        (   2) minutes.
Extended self-test routine
recommended polling time:        (  80) minutes.
SCT capabilities:              (0x003f) SCT Status supported.
                                        SCT Error Recovery Control supported.
                                        SCT Feature Control supported.
                                        SCT Data Table supported.

SMART Attributes Data Structure revision number: 16
Vendor Specific SMART Attributes with Thresholds:
ID# ATTRIBUTE_NAME          FLAG     VALUE WORST THRESH TYPE      UPDATED  WHEN_FAILED RAW_VALUE
  1 Raw_Read_Error_Rate     0x002f   100   100   051    Pre-fail  Always       -       0
  2 Throughput_Performance  0x0026   252   252   000    Old_age   Always       -       0
  3 Spin_Up_Time            0x0023   083   082   025    Pre-fail  Always       -       5369
  4 Start_Stop_Count        0x0032   100   100   000    Old_age   Always       -       259
  5 Reallocated_Sector_Ct   0x0033   252   252   010    Pre-fail  Always       -       0
  7 Seek_Error_Rate         0x002e   252   252   051    Old_age   Always       -       0
  8 Seek_Time_Performance   0x0024   252   252   015    Old_age   Offline      -       0
  9 Power_On_Hours          0x0032   100   100   000    Old_age   Always       -       1131
10 Spin_Retry_Count        0x0032   252   252   051    Old_age   Always       -       0
11 Calibration_Retry_Count 0x0032   252   252   000    Old_age   Always       -       0
12 Power_Cycle_Count       0x0032   100   100   000    Old_age   Always       -       166
191 G-Sense_Error_Rate      0x0022   252   252   000    Old_age   Always       -       0
192 Power-Off_Retract_Count 0x0022   252   252   000    Old_age   Always       -       0
194 Temperature_Celsius     0x0002   064   056   000    Old_age   Always       -       19 (Min/Max 11/46)
195 Hardware_ECC_Recovered  0x003a   100   100   000    Old_age   Always       -       0
196 Reallocated_Event_Count 0x0032   252   252   000    Old_age   Always       -       0
197 Current_Pending_Sector  0x0032   252   252   000    Old_age   Always       -       0
198 Offline_Uncorrectable   0x0030   252   252   000    Old_age   Offline      -       0
199 UDMA_CRC_Error_Count    0x0036   100   100   000    Old_age   Always       -       341
200 Multi_Zone_Error_Rate   0x002a   100   100   000    Old_age   Always       -       0
223 Load_Retry_Count        0x0032   252   252   000    Old_age   Always       -       0
225 Load_Cycle_Count        0x0032   100   100   000    Old_age   Always       -       277

SMART Error Log Version: 1
ATA Error Count: 261 (device log contains only the most recent five errors)
        CR = Command Register [HEX]
        FR = Features Register [HEX]
        SC = Sector Count Register [HEX]
        SN = Sector Number Register [HEX]
        CL = Cylinder Low Register [HEX]
        CH = Cylinder High Register [HEX]
        DH = Device/Head Register [HEX]
        DC = Device Command Register [HEX]
        ER = Error register [HEX]
        ST = Status register [HEX]
Powered_Up_Time is measured from power on, and printed as
DDd+hh:mm:SS.sss where DD=days, hh=hours, mm=minutes,
SS=sec, and sss=millisec. It "wraps" after 49.710 days.

Error 261 occurred at disk power-on lifetime: 972 hours (40 days + 12 hours)
  When the command that caused the error occurred, the device was active or idle.

  After command completion occurred, registers were:
  ER ST SC SN CL CH DH
  -- -- -- -- -- -- --
  84 51 01 00 00 00 e0  Error: ICRC, ABRT 1 sectors at LBA = 0x00000000 = 0

  Commands leading to the command that caused the error were:
  CR FR SC SN CL CH DH DC   Powered_Up_Time  Command/Feature_Name
  -- -- -- -- -- -- -- --  ----------------  --------------------
  c8 00 01 00 00 00 e0 08      00:00:21.102  READ DMA
  ef 03 42 00 00 00 a0 0a      00:00:21.102  SET FEATURES [Set transfer mode]
  ec 00 00 00 00 00 a0 0a      00:00:21.102  IDENTIFY DEVICE
  00 00 01 01 00 00 00 0a      00:00:21.102  NOP [Abort queued commands]
  00 00 01 01 00 00 00 00      00:00:21.094  NOP [Abort queued commands]

Error 260 occurred at disk power-on lifetime: 959 hours (39 days + 23 hours)
  When the command that caused the error occurred, the device was active or idle.

  After command completion occurred, registers were:
  ER ST SC SN CL CH DH
  -- -- -- -- -- -- --
  84 51 01 00 00 00 e0  Error: ICRC, ABRT 1 sectors at LBA = 0x00000000 = 0

  Commands leading to the command that caused the error were:
  CR FR SC SN CL CH DH DC   Powered_Up_Time  Command/Feature_Name
  -- -- -- -- -- -- -- --  ----------------  --------------------
  c8 00 01 00 00 00 e0 08      00:01:23.001  READ DMA
  ef 03 42 00 00 00 a0 0a      00:01:23.001  SET FEATURES [Set transfer mode]
  ec 00 00 00 00 00 a0 0a      00:01:23.001  IDENTIFY DEVICE
  00 00 01 01 00 00 00 0a      00:01:23.001  NOP [Abort queued commands]
  00 00 01 01 00 00 00 00      00:01:22.993  NOP [Abort queued commands]

Error 259 occurred at disk power-on lifetime: 954 hours (39 days + 18 hours)
  When the command that caused the error occurred, the device was active or idle.

  After command completion occurred, registers were:
  ER ST SC SN CL CH DH
  -- -- -- -- -- -- --
  84 51 01 00 00 00 e0  Error: ICRC, ABRT 1 sectors at LBA = 0x00000000 = 0

  Commands leading to the command that caused the error were:
  CR FR SC SN CL CH DH DC   Powered_Up_Time  Command/Feature_Name
  -- -- -- -- -- -- -- --  ----------------  --------------------
  c8 00 01 00 00 00 e0 08      00:00:37.110  READ DMA
  ef 03 42 00 00 00 a0 0a      00:00:37.110  SET FEATURES [Set transfer mode]
  ec 00 00 00 00 00 a0 0a      00:00:37.110  IDENTIFY DEVICE
  00 00 01 01 00 00 00 0a      00:00:37.110  NOP [Abort queued commands]
  00 00 01 01 00 00 00 00      00:00:37.102  NOP [Abort queued commands]

Error 258 occurred at disk power-on lifetime: 954 hours (39 days + 18 hours)
  When the command that caused the error occurred, the device was active or idle.

  After command completion occurred, registers were:
  ER ST SC SN CL CH DH
  -- -- -- -- -- -- --
  84 51 01 00 00 00 e0  Error: ICRC, ABRT 1 sectors at LBA = 0x00000000 = 0

  Commands leading to the command that caused the error were:
  CR FR SC SN CL CH DH DC   Powered_Up_Time  Command/Feature_Name
  -- -- -- -- -- -- -- --  ----------------  --------------------
  c8 00 01 00 00 00 e0 08      00:00:21.871  READ DMA
  ef 03 42 00 00 00 a0 0a      00:00:21.871  SET FEATURES [Set transfer mode]
  ec 00 00 00 00 00 a0 0a      00:00:21.871  IDENTIFY DEVICE
  00 00 01 01 00 00 00 0a      00:00:21.871  NOP [Abort queued commands]
  00 00 01 01 00 00 00 00      00:00:21.863  NOP [Abort queued commands]

Error 257 occurred at disk power-on lifetime: 949 hours (39 days + 13 hours)
  When the command that caused the error occurred, the device was active or idle.

  After command completion occurred, registers were:
  ER ST SC SN CL CH DH
  -- -- -- -- -- -- --
  84 51 01 00 00 00 e0  Error: ICRC, ABRT 1 sectors at LBA = 0x00000000 = 0

  Commands leading to the command that caused the error were:
  CR FR SC SN CL CH DH DC   Powered_Up_Time  Command/Feature_Name
  -- -- -- -- -- -- -- --  ----------------  --------------------
  c8 00 01 00 00 00 e0 08      00:00:02.849  READ DMA
  ef 03 42 00 00 00 a0 0a      00:00:02.849  SET FEATURES [Set transfer mode]
  ec 00 00 00 00 00 a0 0a      00:00:02.849  IDENTIFY DEVICE
  00 00 01 01 00 00 00 0a      00:00:02.849  NOP [Abort queued commands]
  00 00 01 01 00 00 00 00      00:00:02.841  NOP [Abort queued commands]

SMART Self-test log structure revision number 1
No self-tests have been logged.  [To run self-tests, use: smartctl -t]

SMART Selective self-test log data structure revision number 0
Note: revision number not 1 implies that no selective self-test has ever been run
SPAN  MIN_LBA  MAX_LBA  CURRENT_TEST_STATUS
    1        0        0  Completed [00% left] (0-65535)
    2        0        0  Not_testing
    3        0        0  Not_testing
    4        0        0  Not_testing
    5        0        0  Not_testing
Selective self-test flags (0x0):
  After scanning selected spans, do NOT read-scan remainder of disk.
If Selective self-test is pending on power-up, resume after 0 minute delay.

[root@elch /usr/home/holger]#

Viele Grüße,
Holger
 
Ich sehe in den Ausgaben des smartctl nichts Aufsehenerregendes. Neben dem Wechsel der Kabel kannst du eventuell noch die Ports wechseln, ansonsten wüsste ich da nicht weiter.

Rob
 
Ich sehe in den Ausgaben des smartctl nichts Aufsehenerregendes. Neben dem Wechsel der Kabel kannst du eventuell noch die Ports wechseln, ansonsten wüsste ich da nicht weiter.

Rob
Hallo Rob,

danke für's drüber schauen. Ich vermute, dass das Notebook mit irgendetwas nicht ganz klar kommt.

Zusammengefasst:
a) Die Platte lässt sich unter dem internen FreeBSD fehlerfrei einbinden und Daten lassen sich ohne Fehlermeldungen hin- und herkopieren ...
b) Die Platte lässt sich, wenn ich vom intern installierten FreeBSD ein bsdinstall aufrufe, als Platte ansprechen, automatisch formatieren ... ohne diese parity/CRC Fehler
c) ein Test mit smartctl -a gibt keine auffälligen Sachen aus ...
d) Die Platte bringt Fehlermeldungen, wenn ich sie von einem USB-FreeBSD-Installationsmedium aus einbinde ...
e) Die Platte bringrt Fehlermeldungen, wenn ich vom dort installierten FreeBSD aus Daten auf die interne Platte kopiere ...
f) Ein Kabeltausch lässt die Fehlermeldungen von d) und e) nicht verschwinden

Ich werde die Platte mal an unser FreeBSD-Daten-NAS anschließen, das hat auch eSATA-Schnittstellen. Wenn sie da nicht rumspinnt, liegt es wohl doch am Schleppi.

Damit meine ich nicht, dass die Kombination eSATA-Schnittstelle des Notebooks - externe Platte grundsätzlich eine Macke hat. Denn das Nutzen der externen Platte als gewöhnliches zfs Datendevice, auf welches man Daten kopieren kann, funktioniert ja, ohne die Parity/CRC Error Meldungen.
 
Zurück
Oben