[Linux-bruxelles] Attempt to read block from filesystem resulted in short read

Didier MISSON didier.misson at total.com
Ven 29 Déc 11:48:27 CET 2006


Bonsoir,

J'ai encore une fois des problèmes I/O et ça commence à bien faire !
Pas sur mon PC personnel :

Un PC avec Win XP... XP déconne et je décide d'installer Ubuntu 6.10

Déjà quelques problèmes et messages d'erreur lors de l'installation 
d'Ubuntu en mode graphique. 
Je me dis que c'est le partitionnement qui déconne dans cette installation 
graphique... ce ne serait pas la première fois ! 

J'avais donc recommencé l'installation avec le CD Alternate, en mode 
texte, et pas de problème...

J'ai bien tout fignolé. Cela fonctionnait bien.
Mon cousin me téléphone et me dit qu'il était bloqué après avoir essayé de 
démarrer Open Office... 

Evidemment... pffff... il a fini par faire Reset avec le bouton reset du 
boitier :-(
et plusieurs fois, car plus de logon GDM, des messages d'erreur...

Je passe voir : des messages Buffer I/O erreur et me demandant de faire 
tourner fsck manuellement. 

Je me dis, ok, pas trop grave... c'est le reset.
Je boots sur le CD Ubuntu, je lance un terminal et ensuite un sudo 
fsck.ext3 :

mais voilà, ce n'est pas qques erreurs qu'il y a, mais des centaines !!! 

Beaucoup trop pour que soit simplement le reset brutal qui ai provoqué 
cela !

fsck.ext3 tourne longtemps. Je viens de le stopper sans qu'il soit arrivé 
au bout.
C'est clair, je peux réinstaller... Heureusement ça ne touche (pour le 
moment, pas tester l'autre partition) que le système... 

Mais d'où est-ce que ça vient ?
Ce PC tournait depuis presqu'un an en XP avant le blocage d'XP ...
blocage lié à ça ou pas... je ne sais pas.
Le message XP parle de qque chose pas trouvé... problème authentification 
ou déjà problème I/O disque dur ? 

Maintenant sous Ubuntu, j'ai eu des 100aines d'erreurs et ensuite il se 
met à me supprimer des fichiers (corrompus ok)... mais ça fait bcp trop !
Ce n'est plus fiable, même si je reformate et réinstalle ! 

le PC : 

carte mère ASRock (faut que je reboot pour voir la référence exacte)
chipset SIS
disque dur IDE  Maxtor Diamond Max Plus 9,  160 GB ATA/133 HDD 

========================================

ubuntu at ubuntu :/proc$ sudo smartctl -a /dev/hda6 
smartctl version 5.36 [i686-pc-linux-gnu] Copyright (C) 2002-6 Bruce Allen
Home page is http://smartmontools.sourceforge.net/ 

=== START OF INFORMATION SECTION === 
Model Family:     Maxtor DiamondMax Plus 9 family
Device Model:     Maxtor 6Y160P0
Serial Number:    Y449ZY9E
Firmware Version: YAR41BW0
User Capacity:    163 928 604 672 bytes
Device is:        In smartctl database [for details use: -P show] 
ATA Version is:   7
ATA Standard is:  ATA/ATAPI-7 T13 1532D revision 0
Local Time is:    Wed Dec 27 22:15:57 2006 UTC
SMART support is: Available - device has SMART capability.
SMART support is: Enabled

=== START OF READ SMART DATA SECTION ===
SMART overall-health self-assessment test result: PASSED

General SMART Values:
Offline data collection status:  (0x80) Offline data collection activity
                                        was never started. 
                                        Auto Offline Data Collection: 
Enabled.
Self-test execution status:      (   0) The previous self-test routine 
completed
                                        without error or no self-test has 
ever 
                                        been run.
Total time to complete Offline 
data collection:                 ( 302) seconds.
Offline data collection
capabilities:                    (0x5b) SMART execute Offline immediate. 
                                        Auto Offline data collection 
on/off support.
                                        Suspend Offline collection upon 
new
                                        command.
                                        Offline surface scan supported.
                                        Self-test supported.
                                        No Conveyance Self-test supported.
                                        Selective Self-test supported. 
SMART capabilities:            (0x0003) Saves SMART data before entering
                                        power-saving mode.
                                        Supports SMART auto save timer.
Error logging capability:        (0x01) Error logging supported. 
                                        No General Purpose Logging 
support.
Short self-test routine 
recommended polling time:        (   2) minutes.
Extended self-test routine
recommended polling time:        (  72) minutes. 

SMART Attributes Data Structure revision number: 16
Vendor Specific SMART Attributes with Thresholds:
ID# ATTRIBUTE_NAME          FLAG     VALUE WORST THRESH TYPE      UPDATED  
WHEN_FAILED RAW_VALUE
  3 Spin_Up_Time            0x0027   203   203   063    Pre-fail  
Always       -       13797 
  4 Start_Stop_Count        0x0032   253   253   000    Old_age   
Always       -       1117
  5 Reallocated_Sector_Ct   0x0033   232   231   063    Pre-fail  
Always       -       219 
  6 Read_Channel_Margin     0x0001   253   253   100    Pre-fail  
Offline      -       0
  7 Seek_Error_Rate         0x000a   253   252   000    Old_age   
Always       -       0
  8 Seek_Time_Performance   0x0027   253   246   187    Pre-fail  
Always       -       49123 
  9 Power_On_Minutes        0x0032   232   232   000    Old_age   
Always       -       755h+59m
 10 Spin_Retry_Count        0x002b   253   252   157    Pre-fail  
Always       -       0
 11 Calibration_Retry_Count 0x002b   253   252   223    Pre-fail  
Always       -       0 
 12 Power_Cycle_Count       0x0032   251   251   000    Old_age   
Always       -       1099
192 Power-Off_Retract_Count 0x0032   253   253   000    Old_age   
Always       -       0
193 Load_Cycle_Count        0x0032   253   253   000    Old_age   
Always       -       0 
194 Temperature_Celsius     0x0032   253   253   000    Old_age   
Always       -       47
195 Hardware_ECC_Recovered  0x000a   253   252   000    Old_age   
Always       -       2949 
196 Reallocated_Event_Count 0x0008   246   246   000    Old_age   
Offline      -       7
197 Current_Pending_Sector  0x0008   242   242   000    Old_age   
Offline      -       113
198 Offline_Uncorrectable   0x0008   253   253   000    Old_age   
Offline      -       0 
199 UDMA_CRC_Error_Count    0x0008   199   199   000    Old_age   
Offline      -       0
200 Multi_Zone_Error_Rate   0x000a   253   252   000    Old_age   
Always       -       0
201 Soft_Read_Error_Rate    0x000a   253   252   000    Old_age   
Always       -       7 
202 TA_Increase_Count       0x000a   253   242   000    Old_age   
Always       -       0
203 Run_Out_Cancel          0x000b   253   248   180    Pre-fail  
Always       -       148
204 Shock_Count_Write_Opern 0x000a   253   251   000    Old_age   
Always       -       0 
205 Shock_Rate_Write_Opern  0x000a   253   252   000    Old_age   
Always       -       0
207 Spin_High_Current       0x002a   253   252   000    Old_age   
Always       -       0
208 Spin_Buzz               0x002a   253   252   000    Old_age   
Always       -       0 
209 Offline_Seek_Performnce 0x0024   191   191   000    Old_age   
Offline      -       0
 99 Unknown_Attribute       0x0004   253   253   000    Old_age   
Offline      -       0
100 Unknown_Attribute       0x0004   253   253   000    Old_age   
Offline      -       0 
101 Unknown_Attribute       0x0004   253   253   000    Old_age   
Offline      -       0

SMART Error Log Version: 1
ATA Error Count: 1695 (device log contains only the most recent five 
errors)
        CR = Command Register [HEX] 
        FR = Features Register [HEX]
        SC = Sector Count Register [HEX]
        SN = Sector Number Register [HEX]
        CL = Cylinder Low Register [HEX]
        CH = Cylinder High Register [HEX]
        DH = Device/Head Register [HEX]
        DC = Device Command Register [HEX]
        ER = Error register [HEX]
        ST = Status register [HEX]
Powered_Up_Time is measured from power on, and printed as 
DDd+hh:mm:SS.sss where DD=days, hh=hours, mm=minutes,
SS=sec, and sss=millisec. It "wraps" after 49.710 days.

Error 1695 occurred at disk power-on lifetime: 6852 hours (285 days + 12 
hours)
  When the command that caused the error occurred, the device was in an 
unknown state. 

  After command completion occurred, registers were:
  ER ST SC SN CL CH DH
  -- -- -- -- -- -- --
  40 51 01 dc 63 8a e0  Error: UNC 1 sectors at LBA = 0x008a63dc = 9069532

  Commands leading to the command that caused the error were: 
  CR FR SC SN CL CH DH DC   Powered_Up_Time  Command/Feature_Name
  -- -- -- -- -- -- -- --  ----------------  --------------------
  25 00 01 dc 63 8a e0 08      01:56:33.040  READ DMA EXT
  25 00 02 db 63 8a e0 08      01:56: 32.032  READ DMA EXT
  25 00 03 da 63 8a e0 08      01:56:30.800  READ DMA EXT
  25 00 01 dc 63 8a e0 08      01:56:29.568  READ DMA EXT
  25 00 02 db 63 8a e0 08      01:56:28.320  READ DMA EXT

Error 1694 occurred at disk power-on lifetime: 6852 hours (285 days + 12 
hours) 
  When the command that caused the error occurred, the device was in an 
unknown state.

  After command completion occurred, registers were:
  ER ST SC SN CL CH DH
  -- -- -- -- -- -- --
  40 51 02 db 63 8a e0  Error: UNC 2 sectors at LBA = 0x008a63db = 9069531 


  Commands leading to the command that caused the error were:
  CR FR SC SN CL CH DH DC   Powered_Up_Time  Command/Feature_Name
  -- -- -- -- -- -- -- --  ----------------  --------------------
  25 00 02 db 63 8a e0 08      01:56: 32.032  READ DMA EXT
  25 00 03 da 63 8a e0 08      01:56:30.800  READ DMA EXT
  25 00 01 dc 63 8a e0 08      01:56:29.568  READ DMA EXT
  25 00 02 db 63 8a e0 08      01:56:28.320  READ DMA EXT
  25 00 03 da 63 8a e0 08      01:56: 27.088  READ DMA EXT

Error 1693 occurred at disk power-on lifetime: 6852 hours (285 days + 12 
hours)
  When the command that caused the error occurred, the device was in an 
unknown state.

  After command completion occurred, registers were: 
  ER ST SC SN CL CH DH
  -- -- -- -- -- -- --
  40 51 02 da 63 8a e0  Error: UNC 2 sectors at LBA = 0x008a63da = 9069530

  Commands leading to the command that caused the error were:
  CR FR SC SN CL CH DH DC   Powered_Up_Time  Command/Feature_Name 
  -- -- -- -- -- -- -- --  ----------------  --------------------
  25 00 03 da 63 8a e0 08      01:56:30.800  READ DMA EXT
  25 00 01 dc 63 8a e0 08      01:56:29.568  READ DMA EXT
  25 00 02 db 63 8a e0 08      01:56: 28.320  READ DMA EXT
  25 00 03 da 63 8a e0 08      01:56:27.088  READ DMA EXT
  25 00 3d dd 63 8a e0 08      01:56:27.072  READ DMA EXT

Error 1692 occurred at disk power-on lifetime: 6852 hours (285 days + 12 
hours) 
  When the command that caused the error occurred, the device was in an 
unknown state.

  After command completion occurred, registers were:
  ER ST SC SN CL CH DH
  -- -- -- -- -- -- --
  40 51 01 dc 63 8a e0  Error: UNC 1 sectors at LBA = 0x008a63dc = 9069532 


  Commands leading to the command that caused the error were:
  CR FR SC SN CL CH DH DC   Powered_Up_Time  Command/Feature_Name
  -- -- -- -- -- -- -- --  ----------------  --------------------
  25 00 01 dc 63 8a e0 08      01:56: 29.568  READ DMA EXT
  25 00 02 db 63 8a e0 08      01:56:28.320  READ DMA EXT
  25 00 03 da 63 8a e0 08      01:56:27.088  READ DMA EXT
  25 00 3d dd 63 8a e0 08      01:56:27.072  READ DMA EXT
  25 00 3e dc 63 8a e0 08      01:56: 25.760  READ DMA EXT

Error 1691 occurred at disk power-on lifetime: 6852 hours (285 days + 12 
hours)
  When the command that caused the error occurred, the device was in an 
unknown state.

  After command completion occurred, registers were: 
  ER ST SC SN CL CH DH
  -- -- -- -- -- -- --
  40 51 02 db 63 8a e0  Error: UNC 2 sectors at LBA = 0x008a63db = 9069531

  Commands leading to the command that caused the error were:
  CR FR SC SN CL CH DH DC   Powered_Up_Time  Command/Feature_Name 
  -- -- -- -- -- -- -- --  ----------------  --------------------
  25 00 02 db 63 8a e0 08      01:56:28.320  READ DMA EXT
  25 00 03 da 63 8a e0 08      01:56:27.088  READ DMA EXT
  25 00 3d dd 63 8a e0 08      01:56: 27.072  READ DMA EXT
  25 00 3e dc 63 8a e0 08      01:56:25.760  READ DMA EXT
  25 00 3f db 63 8a e0 08      01:56:24.528  READ DMA EXT

SMART Self-test log structure revision number 1
No self-tests have been logged.  [To run self-tests, use: smartctl -t] 


SMART Selective self-test log data structure revision number 1
 SPAN  MIN_LBA  MAX_LBA  CURRENT_TEST_STATUS
    1        0        0  Not_testing
    2        0        0  Not_testing
    3        0        0  Not_testing 
    4        0        0  Not_testing
    5        0        0  Not_testing
Selective self-test flags (0x0):
  After scanning selected spans, do NOT read-scan remainder of disk.
If Selective self-test is pending on power-up, resume after 0 minute 
delay. 

ubuntu at ubuntu:/proc$ 





=========================================

sudo fsck.ext3 /dev/hd6

quelques centaines d'erreur de lecture de ce genre :

Erreur de lecture du bloc 753805 (Attempt to read block from filesystem 
resulted in short read) lorsque examen en cours des inodes.  Ignorer 
l'erreur<o>? oui 

Forcer la ré-écriture<o>? oui

Erreur de lecture du bloc 753806 (Attempt to read block from filesystem 
resulted in short read) lorsque examen en cours des inodes.  Ignorer 
l'erreur<o>? oui


...



Erreur de lecture du bloc 950276 (Attempt to read block from filesystem 
resulted in short read) lorsque examen en cours des inodes.  Ignorer 
l'erreur<o>? oui

Forcer la ré-écriture<o>? oui

Passe 2 : vérification de la structure des répertoires
L'entrée 'tmp' dans / (2) a un inode effacé/non utilisé 475137.  
Effacer<o>? oui

L'entrée ' gaim.mo' dans /usr/share/locale/ar/LC_MESSAGES (65976) a un 
inode effacé/non utilisé 71954.  Effacer<o>? oui


...



L'entrée 'debconf-updatepo.1.gz' dans /usr/share/man/fr/man1 (66050) a un 
inode effacé/non utilisé 73217.  Effacer<o>? oui 

L'entrée 'locale.alias' dans /usr/share/locale (65787) a un inode 
effacé/non utilisé 70793.  Effacer<o>? oui


L'entrée 'cups_de.po' dans /usr/share/locale/de (65800) a un inode 
effacé/non utilisé 70831.  Effacer<o>? oui 


...


L'entrée 'mime.types.5.gz' dans /usr/share/man/man5 (66371) a un inode 
effacé/non utilisé 70894.  Effacer<o>? oui

L'entrée 'printers.conf.5.gz' dans /usr/share/man/man5 (66371) a un inode 
effacé/non utilisé 70895.  Effacer<o>? oui 

L'entrée 'variables.5snmp.gz' dans /usr/share/man/man5 (66371) a un inode 
effacé/non utilisé 70904.  Effacer<o>? oui

L'entrée 'mib2c.conf.5snmp.gz' dans /usr/share/man/man5 (66371) a un inode 
effacé/non utilisé 70905.  Effacer<o>? oui 

L'entrée 'snmp.conf.5snmp.gz' dans /usr/share/man/man5 (66371) a un inode 
effacé/non utilisé 70906.  Effacer<o>? 


...

=========================================

A votre avis ?

Le disque dur qui est en train de rendre l'âme ? 
(les disques durs ont-ils une âme ? Votez par SMS au 3999 .... lol)

Il faut encore que je démonte les câbles, tout secourer, souffler sur les 
poussières et réinstaller ? (pas sérieux ça) 

marre de ce genre de m...
J'ai déjà eu 3 problèmes de ce genre sur mon propre PC, et j'ai fini par 
retirer le SATA et remettre un bon vieux IDE...
et sur ce PC ci, c'est l' IDE (ou la carte mère) qui remet ça ! 

:-(

Que faire pour être sur de retrouver un PC et disque dur stable ?

Merci 

-- 
Didier

http://didier.misson.net 





Plus d'informations sur la liste de diffusion Linux-bruxelles