[Linux-bruxelles] Attempt to read block from filesystem resulted in short read

denis(mailinux,GNUtoo) GNUtoo at no-log.org
Ven 29 Déc 15:20:29 CET 2006


> Bonsoir,
>
> J'ai encore une fois des problèmes I/O et ça commence à bien faire !
> Pas sur mon PC personnel :
>
> Un PC avec Win XP... XP déconne et je décide d'installer Ubuntu 6.10
>
> Déjà quelques problèmes et messages d'erreur lors de l'installation
> d'Ubuntu en mode graphique.
> Je me dis que c'est le partitionnement qui déconne dans cette installation
> graphique... ce ne serait pas la première fois !
>
> J'avais donc recommencé l'installation avec le CD Alternate, en mode
> texte, et pas de problème...
>
> J'ai bien tout fignolé. Cela fonctionnait bien.
> Mon cousin me téléphone et me dit qu'il était bloqué après avoir essayé de
> démarrer Open Office...
>
> Evidemment... pffff... il a fini par faire Reset avec le bouton reset du
> boitier :-(
> et plusieurs fois, car plus de logon GDM, des messages d'erreur...
>
> Je passe voir : des messages Buffer I/O erreur et me demandant de faire
> tourner fsck manuellement.
>
> Je me dis, ok, pas trop grave... c'est le reset.
> Je boots sur le CD Ubuntu, je lance un terminal et ensuite un sudo
> fsck.ext3 :
>
> mais voilà, ce n'est pas qques erreurs qu'il y a, mais des centaines !!!
>
> Beaucoup trop pour que soit simplement le reset brutal qui ai provoqué
> cela !
>
> fsck.ext3 tourne longtemps. Je viens de le stopper sans qu'il soit arrivé
> au bout.
> C'est clair, je peux réinstaller... Heureusement ça ne touche (pour le
> moment, pas tester l'autre partition) que le système...
>
> Mais d'où est-ce que ça vient ?
> Ce PC tournait depuis presqu'un an en XP avant le blocage d'XP ...
> blocage lié à ça ou pas... je ne sais pas.
> Le message XP parle de qque chose pas trouvé... problème authentification
> ou déjà problème I/O disque dur ?
>
> Maintenant sous Ubuntu, j'ai eu des 100aines d'erreurs et ensuite il se
> met à me supprimer des fichiers (corrompus ok)... mais ça fait bcp trop !
> Ce n'est plus fiable, même si je reformate et réinstalle !
>
> le PC :
>
> carte mère ASRock (faut que je reboot pour voir la référence exacte)
> chipset SIS
> disque dur IDE  Maxtor Diamond Max Plus 9,  160 GB ATA/133 HDD
>
> ========================================
>
> ubuntu at ubuntu :/proc$ sudo smartctl -a /dev/hda6
> smartctl version 5.36 [i686-pc-linux-gnu] Copyright (C) 2002-6 Bruce Allen
> Home page is http://smartmontools.sourceforge.net/
>
> === START OF INFORMATION SECTION ===
> Model Family:     Maxtor DiamondMax Plus 9 family
> Device Model:     Maxtor 6Y160P0
> Serial Number:    Y449ZY9E
> Firmware Version: YAR41BW0
> User Capacity:    163 928 604 672 bytes
> Device is:        In smartctl database [for details use: -P show]
> ATA Version is:   7
> ATA Standard is:  ATA/ATAPI-7 T13 1532D revision 0
> Local Time is:    Wed Dec 27 22:15:57 2006 UTC
> SMART support is: Available - device has SMART capability.
> SMART support is: Enabled
>
> === START OF READ SMART DATA SECTION ===
> SMART overall-health self-assessment test result: PASSED
>
> General SMART Values:
> Offline data collection status:  (0x80) Offline data collection activity
>                                         was never started.
>                                         Auto Offline Data Collection:
> Enabled.
> Self-test execution status:      (   0) The previous self-test routine
> completed
>                                         without error or no self-test has
> ever
>                                         been run.
> Total time to complete Offline
> data collection:                 ( 302) seconds.
> Offline data collection
> capabilities:                    (0x5b) SMART execute Offline immediate.
>                                         Auto Offline data collection
> on/off support.
>                                         Suspend Offline collection upon
> new
>                                         command.
>                                         Offline surface scan supported.
>                                         Self-test supported.
>                                         No Conveyance Self-test supported.
>                                         Selective Self-test supported.
> SMART capabilities:            (0x0003) Saves SMART data before entering
>                                         power-saving mode.
>                                         Supports SMART auto save timer.
> Error logging capability:        (0x01) Error logging supported.
>                                         No General Purpose Logging
> support.
> Short self-test routine
> recommended polling time:        (   2) minutes.
> Extended self-test routine
> recommended polling time:        (  72) minutes.
>
> SMART Attributes Data Structure revision number: 16
> Vendor Specific SMART Attributes with Thresholds:
> ID# ATTRIBUTE_NAME          FLAG     VALUE WORST THRESH TYPE      UPDATED
> WHEN_FAILED RAW_VALUE
>   3 Spin_Up_Time            0x0027   203   203   063    Pre-fail
> Always       -       13797
>   4 Start_Stop_Count        0x0032   253   253   000    Old_age
> Always       -       1117
>   5 Reallocated_Sector_Ct   0x0033   232   231   063    Pre-fail
> Always       -       219
>   6 Read_Channel_Margin     0x0001   253   253   100    Pre-fail
> Offline      -       0
>   7 Seek_Error_Rate         0x000a   253   252   000    Old_age
> Always       -       0
>   8 Seek_Time_Performance   0x0027   253   246   187    Pre-fail
> Always       -       49123
>   9 Power_On_Minutes        0x0032   232   232   000    Old_age
> Always       -       755h+59m
>  10 Spin_Retry_Count        0x002b   253   252   157    Pre-fail
> Always       -       0
>  11 Calibration_Retry_Count 0x002b   253   252   223    Pre-fail
> Always       -       0
>  12 Power_Cycle_Count       0x0032   251   251   000    Old_age
> Always       -       1099
> 192 Power-Off_Retract_Count 0x0032   253   253   000    Old_age
> Always       -       0
> 193 Load_Cycle_Count        0x0032   253   253   000    Old_age
> Always       -       0
> 194 Temperature_Celsius     0x0032   253   253   000    Old_age
> Always       -       47
> 195 Hardware_ECC_Recovered  0x000a   253   252   000    Old_age
> Always       -       2949
> 196 Reallocated_Event_Count 0x0008   246   246   000    Old_age
> Offline      -       7
> 197 Current_Pending_Sector  0x0008   242   242   000    Old_age
> Offline      -       113
> 198 Offline_Uncorrectable   0x0008   253   253   000    Old_age
> Offline      -       0
> 199 UDMA_CRC_Error_Count    0x0008   199   199   000    Old_age
> Offline      -       0
> 200 Multi_Zone_Error_Rate   0x000a   253   252   000    Old_age
> Always       -       0
> 201 Soft_Read_Error_Rate    0x000a   253   252   000    Old_age
> Always       -       7
> 202 TA_Increase_Count       0x000a   253   242   000    Old_age
> Always       -       0
> 203 Run_Out_Cancel          0x000b   253   248   180    Pre-fail
> Always       -       148
> 204 Shock_Count_Write_Opern 0x000a   253   251   000    Old_age
> Always       -       0
> 205 Shock_Rate_Write_Opern  0x000a   253   252   000    Old_age
> Always       -       0
> 207 Spin_High_Current       0x002a   253   252   000    Old_age
> Always       -       0
> 208 Spin_Buzz               0x002a   253   252   000    Old_age
> Always       -       0
> 209 Offline_Seek_Performnce 0x0024   191   191   000    Old_age
> Offline      -       0
>  99 Unknown_Attribute       0x0004   253   253   000    Old_age
> Offline      -       0
> 100 Unknown_Attribute       0x0004   253   253   000    Old_age
> Offline      -       0
> 101 Unknown_Attribute       0x0004   253   253   000    Old_age
> Offline      -       0
>
> SMART Error Log Version: 1
> ATA Error Count: 1695 (device log contains only the most recent five
> errors)
>         CR = Command Register [HEX]
>         FR = Features Register [HEX]
>         SC = Sector Count Register [HEX]
>         SN = Sector Number Register [HEX]
>         CL = Cylinder Low Register [HEX]
>         CH = Cylinder High Register [HEX]
>         DH = Device/Head Register [HEX]
>         DC = Device Command Register [HEX]
>         ER = Error register [HEX]
>         ST = Status register [HEX]
> Powered_Up_Time is measured from power on, and printed as
> DDd+hh:mm:SS.sss where DD=days, hh=hours, mm=minutes,
> SS=sec, and sss=millisec. It "wraps" after 49.710 days.
>
> Error 1695 occurred at disk power-on lifetime: 6852 hours (285 days + 12
> hours)
>   When the command that caused the error occurred, the device was in an
> unknown state.
>
>   After command completion occurred, registers were:
>   ER ST SC SN CL CH DH
>   -- -- -- -- -- -- --
>   40 51 01 dc 63 8a e0  Error: UNC 1 sectors at LBA = 0x008a63dc = 9069532
>
>   Commands leading to the command that caused the error were:
>   CR FR SC SN CL CH DH DC   Powered_Up_Time  Command/Feature_Name
>   -- -- -- -- -- -- -- --  ----------------  --------------------
>   25 00 01 dc 63 8a e0 08      01:56:33.040  READ DMA EXT
>   25 00 02 db 63 8a e0 08      01:56: 32.032  READ DMA EXT
>   25 00 03 da 63 8a e0 08      01:56:30.800  READ DMA EXT
>   25 00 01 dc 63 8a e0 08      01:56:29.568  READ DMA EXT
>   25 00 02 db 63 8a e0 08      01:56:28.320  READ DMA EXT
>
> Error 1694 occurred at disk power-on lifetime: 6852 hours (285 days + 12
> hours)
>   When the command that caused the error occurred, the device was in an
> unknown state.
>
>   After command completion occurred, registers were:
>   ER ST SC SN CL CH DH
>   -- -- -- -- -- -- --
>   40 51 02 db 63 8a e0  Error: UNC 2 sectors at LBA = 0x008a63db = 9069531
>
>
>   Commands leading to the command that caused the error were:
>   CR FR SC SN CL CH DH DC   Powered_Up_Time  Command/Feature_Name
>   -- -- -- -- -- -- -- --  ----------------  --------------------
>   25 00 02 db 63 8a e0 08      01:56: 32.032  READ DMA EXT
>   25 00 03 da 63 8a e0 08      01:56:30.800  READ DMA EXT
>   25 00 01 dc 63 8a e0 08      01:56:29.568  READ DMA EXT
>   25 00 02 db 63 8a e0 08      01:56:28.320  READ DMA EXT
>   25 00 03 da 63 8a e0 08      01:56: 27.088  READ DMA EXT
>
> Error 1693 occurred at disk power-on lifetime: 6852 hours (285 days + 12
> hours)
>   When the command that caused the error occurred, the device was in an
> unknown state.
>
>   After command completion occurred, registers were:
>   ER ST SC SN CL CH DH
>   -- -- -- -- -- -- --
>   40 51 02 da 63 8a e0  Error: UNC 2 sectors at LBA = 0x008a63da = 9069530
>
>   Commands leading to the command that caused the error were:
>   CR FR SC SN CL CH DH DC   Powered_Up_Time  Command/Feature_Name
>   -- -- -- -- -- -- -- --  ----------------  --------------------
>   25 00 03 da 63 8a e0 08      01:56:30.800  READ DMA EXT
>   25 00 01 dc 63 8a e0 08      01:56:29.568  READ DMA EXT
>   25 00 02 db 63 8a e0 08      01:56: 28.320  READ DMA EXT
>   25 00 03 da 63 8a e0 08      01:56:27.088  READ DMA EXT
>   25 00 3d dd 63 8a e0 08      01:56:27.072  READ DMA EXT
>
> Error 1692 occurred at disk power-on lifetime: 6852 hours (285 days + 12
> hours)
>   When the command that caused the error occurred, the device was in an
> unknown state.
>
>   After command completion occurred, registers were:
>   ER ST SC SN CL CH DH
>   -- -- -- -- -- -- --
>   40 51 01 dc 63 8a e0  Error: UNC 1 sectors at LBA = 0x008a63dc = 9069532
>
>
>   Commands leading to the command that caused the error were:
>   CR FR SC SN CL CH DH DC   Powered_Up_Time  Command/Feature_Name
>   -- -- -- -- -- -- -- --  ----------------  --------------------
>   25 00 01 dc 63 8a e0 08      01:56: 29.568  READ DMA EXT
>   25 00 02 db 63 8a e0 08      01:56:28.320  READ DMA EXT
>   25 00 03 da 63 8a e0 08      01:56:27.088  READ DMA EXT
>   25 00 3d dd 63 8a e0 08      01:56:27.072  READ DMA EXT
>   25 00 3e dc 63 8a e0 08      01:56: 25.760  READ DMA EXT
>
> Error 1691 occurred at disk power-on lifetime: 6852 hours (285 days + 12
> hours)
>   When the command that caused the error occurred, the device was in an
> unknown state.
>
>   After command completion occurred, registers were:
>   ER ST SC SN CL CH DH
>   -- -- -- -- -- -- --
>   40 51 02 db 63 8a e0  Error: UNC 2 sectors at LBA = 0x008a63db = 9069531
>
>   Commands leading to the command that caused the error were:
>   CR FR SC SN CL CH DH DC   Powered_Up_Time  Command/Feature_Name
>   -- -- -- -- -- -- -- --  ----------------  --------------------
>   25 00 02 db 63 8a e0 08      01:56:28.320  READ DMA EXT
>   25 00 03 da 63 8a e0 08      01:56:27.088  READ DMA EXT
>   25 00 3d dd 63 8a e0 08      01:56: 27.072  READ DMA EXT
>   25 00 3e dc 63 8a e0 08      01:56:25.760  READ DMA EXT
>   25 00 3f db 63 8a e0 08      01:56:24.528  READ DMA EXT
>
> SMART Self-test log structure revision number 1
> No self-tests have been logged.  [To run self-tests, use: smartctl -t]
>
>
> SMART Selective self-test log data structure revision number 1
>  SPAN  MIN_LBA  MAX_LBA  CURRENT_TEST_STATUS
>     1        0        0  Not_testing
>     2        0        0  Not_testing
>     3        0        0  Not_testing
>     4        0        0  Not_testing
>     5        0        0  Not_testing
> Selective self-test flags (0x0):
>   After scanning selected spans, do NOT read-scan remainder of disk.
> If Selective self-test is pending on power-up, resume after 0 minute
> delay.
>
> ubuntu at ubuntu:/proc$
>
>
>
>
>
> =========================================
>
> sudo fsck.ext3 /dev/hd6
>
> quelques centaines d'erreur de lecture de ce genre :
>
> Erreur de lecture du bloc 753805 (Attempt to read block from filesystem
> resulted in short read) lorsque examen en cours des inodes.  Ignorer
> l'erreur<o>? oui
>
> Forcer la ré-écriture<o>? oui
>
> Erreur de lecture du bloc 753806 (Attempt to read block from filesystem
> resulted in short read) lorsque examen en cours des inodes.  Ignorer
> l'erreur<o>? oui
>
>
> ...
>
>
>
> Erreur de lecture du bloc 950276 (Attempt to read block from filesystem
> resulted in short read) lorsque examen en cours des inodes.  Ignorer
> l'erreur<o>? oui
>
> Forcer la ré-écriture<o>? oui
>
> Passe 2 : vérification de la structure des répertoires
> L'entrée 'tmp' dans / (2) a un inode effacé/non utilisé 475137.
> Effacer<o>? oui
>
> L'entrée ' gaim.mo' dans /usr/share/locale/ar/LC_MESSAGES (65976) a un
> inode effacé/non utilisé 71954.  Effacer<o>? oui
>
>
> ...
>
>
>
> L'entrée 'debconf-updatepo.1.gz' dans /usr/share/man/fr/man1 (66050) a un
> inode effacé/non utilisé 73217.  Effacer<o>? oui
>
> L'entrée 'locale.alias' dans /usr/share/locale (65787) a un inode
> effacé/non utilisé 70793.  Effacer<o>? oui
>
>
> L'entrée 'cups_de.po' dans /usr/share/locale/de (65800) a un inode
> effacé/non utilisé 70831.  Effacer<o>? oui
>
>
> ...
>
>
> L'entrée 'mime.types.5.gz' dans /usr/share/man/man5 (66371) a un inode
> effacé/non utilisé 70894.  Effacer<o>? oui
>
> L'entrée 'printers.conf.5.gz' dans /usr/share/man/man5 (66371) a un inode
> effacé/non utilisé 70895.  Effacer<o>? oui
>
> L'entrée 'variables.5snmp.gz' dans /usr/share/man/man5 (66371) a un inode
> effacé/non utilisé 70904.  Effacer<o>? oui
>
> L'entrée 'mib2c.conf.5snmp.gz' dans /usr/share/man/man5 (66371) a un inode
> effacé/non utilisé 70905.  Effacer<o>? oui
>
> L'entrée 'snmp.conf.5snmp.gz' dans /usr/share/man/man5 (66371) a un inode
> effacé/non utilisé 70906.  Effacer<o>?
>
>
> ...
>
> =========================================
>
> A votre avis ?
>
> Le disque dur qui est en train de rendre l'âme ?
> (les disques durs ont-ils une âme ? Votez par SMS au 3999 .... lol)
>
> Il faut encore que je démonte les câbles, tout secourer, souffler sur les
> poussières et réinstaller ? (pas sérieux ça)
>
> marre de ce genre de m...
> J'ai déjà eu 3 problèmes de ce genre sur mon propre PC, et j'ai fini par
> retirer le SATA et remettre un bon vieux IDE...
> et sur ce PC ci, c'est l' IDE (ou la carte mère) qui remet ça !
>
> :-(
>
> Que faire pour être sur de retrouver un PC et disque dur stable ?
>
> Merci
>
> --
> Didier
>
> http://didier.misson.net
>
>
>
>
ca peut etre:
-le disque dur
-le controleur ide de la carte mere
sinon les drivers pata du 2.6.19 sont mieux ecrits mais tout nouveau(bug
possibles)
attention ces drivers changent ton /dev/hda en /dev/sda...donc faut
changer fstab et le fichier de config de grub

affin de savoir si c'est le disque dur ou le controleur ide il suffit
d'essayer avec un autre disque dur ou une autre carte mere ou regarder les
erreurs cdrom(attention meme ubuntu swap sur le disque dur si une
partiotion swap est presente)
donc:
*boot sur cd
*deswap sur le disque dur
si ca plante au bout d'un moment c'est donc la puce ide ou le drivers ata
qui fait planter(sinon essaie un cd d'install xp)




Plus d'informations sur la liste de diffusion Linux-bruxelles