[Linux-bruxelles] Attempt to read block from filesystem resulted in short read
Didier MISSON
didier.misson at total.com
Ven 29 Déc 11:48:27 CET 2006
Bonsoir,
J'ai encore une fois des problèmes I/O et ça commence à bien faire !
Pas sur mon PC personnel :
Un PC avec Win XP... XP déconne et je décide d'installer Ubuntu 6.10
Déjà quelques problèmes et messages d'erreur lors de l'installation
d'Ubuntu en mode graphique.
Je me dis que c'est le partitionnement qui déconne dans cette installation
graphique... ce ne serait pas la première fois !
J'avais donc recommencé l'installation avec le CD Alternate, en mode
texte, et pas de problème...
J'ai bien tout fignolé. Cela fonctionnait bien.
Mon cousin me téléphone et me dit qu'il était bloqué après avoir essayé de
démarrer Open Office...
Evidemment... pffff... il a fini par faire Reset avec le bouton reset du
boitier :-(
et plusieurs fois, car plus de logon GDM, des messages d'erreur...
Je passe voir : des messages Buffer I/O erreur et me demandant de faire
tourner fsck manuellement.
Je me dis, ok, pas trop grave... c'est le reset.
Je boots sur le CD Ubuntu, je lance un terminal et ensuite un sudo
fsck.ext3 :
mais voilà, ce n'est pas qques erreurs qu'il y a, mais des centaines !!!
Beaucoup trop pour que soit simplement le reset brutal qui ai provoqué
cela !
fsck.ext3 tourne longtemps. Je viens de le stopper sans qu'il soit arrivé
au bout.
C'est clair, je peux réinstaller... Heureusement ça ne touche (pour le
moment, pas tester l'autre partition) que le système...
Mais d'où est-ce que ça vient ?
Ce PC tournait depuis presqu'un an en XP avant le blocage d'XP ...
blocage lié à ça ou pas... je ne sais pas.
Le message XP parle de qque chose pas trouvé... problème authentification
ou déjà problème I/O disque dur ?
Maintenant sous Ubuntu, j'ai eu des 100aines d'erreurs et ensuite il se
met à me supprimer des fichiers (corrompus ok)... mais ça fait bcp trop !
Ce n'est plus fiable, même si je reformate et réinstalle !
le PC :
carte mère ASRock (faut que je reboot pour voir la référence exacte)
chipset SIS
disque dur IDE Maxtor Diamond Max Plus 9, 160 GB ATA/133 HDD
========================================
ubuntu at ubuntu :/proc$ sudo smartctl -a /dev/hda6
smartctl version 5.36 [i686-pc-linux-gnu] Copyright (C) 2002-6 Bruce Allen
Home page is http://smartmontools.sourceforge.net/
=== START OF INFORMATION SECTION ===
Model Family: Maxtor DiamondMax Plus 9 family
Device Model: Maxtor 6Y160P0
Serial Number: Y449ZY9E
Firmware Version: YAR41BW0
User Capacity: 163 928 604 672 bytes
Device is: In smartctl database [for details use: -P show]
ATA Version is: 7
ATA Standard is: ATA/ATAPI-7 T13 1532D revision 0
Local Time is: Wed Dec 27 22:15:57 2006 UTC
SMART support is: Available - device has SMART capability.
SMART support is: Enabled
=== START OF READ SMART DATA SECTION ===
SMART overall-health self-assessment test result: PASSED
General SMART Values:
Offline data collection status: (0x80) Offline data collection activity
was never started.
Auto Offline Data Collection:
Enabled.
Self-test execution status: ( 0) The previous self-test routine
completed
without error or no self-test has
ever
been run.
Total time to complete Offline
data collection: ( 302) seconds.
Offline data collection
capabilities: (0x5b) SMART execute Offline immediate.
Auto Offline data collection
on/off support.
Suspend Offline collection upon
new
command.
Offline surface scan supported.
Self-test supported.
No Conveyance Self-test supported.
Selective Self-test supported.
SMART capabilities: (0x0003) Saves SMART data before entering
power-saving mode.
Supports SMART auto save timer.
Error logging capability: (0x01) Error logging supported.
No General Purpose Logging
support.
Short self-test routine
recommended polling time: ( 2) minutes.
Extended self-test routine
recommended polling time: ( 72) minutes.
SMART Attributes Data Structure revision number: 16
Vendor Specific SMART Attributes with Thresholds:
ID# ATTRIBUTE_NAME FLAG VALUE WORST THRESH TYPE UPDATED
WHEN_FAILED RAW_VALUE
3 Spin_Up_Time 0x0027 203 203 063 Pre-fail
Always - 13797
4 Start_Stop_Count 0x0032 253 253 000 Old_age
Always - 1117
5 Reallocated_Sector_Ct 0x0033 232 231 063 Pre-fail
Always - 219
6 Read_Channel_Margin 0x0001 253 253 100 Pre-fail
Offline - 0
7 Seek_Error_Rate 0x000a 253 252 000 Old_age
Always - 0
8 Seek_Time_Performance 0x0027 253 246 187 Pre-fail
Always - 49123
9 Power_On_Minutes 0x0032 232 232 000 Old_age
Always - 755h+59m
10 Spin_Retry_Count 0x002b 253 252 157 Pre-fail
Always - 0
11 Calibration_Retry_Count 0x002b 253 252 223 Pre-fail
Always - 0
12 Power_Cycle_Count 0x0032 251 251 000 Old_age
Always - 1099
192 Power-Off_Retract_Count 0x0032 253 253 000 Old_age
Always - 0
193 Load_Cycle_Count 0x0032 253 253 000 Old_age
Always - 0
194 Temperature_Celsius 0x0032 253 253 000 Old_age
Always - 47
195 Hardware_ECC_Recovered 0x000a 253 252 000 Old_age
Always - 2949
196 Reallocated_Event_Count 0x0008 246 246 000 Old_age
Offline - 7
197 Current_Pending_Sector 0x0008 242 242 000 Old_age
Offline - 113
198 Offline_Uncorrectable 0x0008 253 253 000 Old_age
Offline - 0
199 UDMA_CRC_Error_Count 0x0008 199 199 000 Old_age
Offline - 0
200 Multi_Zone_Error_Rate 0x000a 253 252 000 Old_age
Always - 0
201 Soft_Read_Error_Rate 0x000a 253 252 000 Old_age
Always - 7
202 TA_Increase_Count 0x000a 253 242 000 Old_age
Always - 0
203 Run_Out_Cancel 0x000b 253 248 180 Pre-fail
Always - 148
204 Shock_Count_Write_Opern 0x000a 253 251 000 Old_age
Always - 0
205 Shock_Rate_Write_Opern 0x000a 253 252 000 Old_age
Always - 0
207 Spin_High_Current 0x002a 253 252 000 Old_age
Always - 0
208 Spin_Buzz 0x002a 253 252 000 Old_age
Always - 0
209 Offline_Seek_Performnce 0x0024 191 191 000 Old_age
Offline - 0
99 Unknown_Attribute 0x0004 253 253 000 Old_age
Offline - 0
100 Unknown_Attribute 0x0004 253 253 000 Old_age
Offline - 0
101 Unknown_Attribute 0x0004 253 253 000 Old_age
Offline - 0
SMART Error Log Version: 1
ATA Error Count: 1695 (device log contains only the most recent five
errors)
CR = Command Register [HEX]
FR = Features Register [HEX]
SC = Sector Count Register [HEX]
SN = Sector Number Register [HEX]
CL = Cylinder Low Register [HEX]
CH = Cylinder High Register [HEX]
DH = Device/Head Register [HEX]
DC = Device Command Register [HEX]
ER = Error register [HEX]
ST = Status register [HEX]
Powered_Up_Time is measured from power on, and printed as
DDd+hh:mm:SS.sss where DD=days, hh=hours, mm=minutes,
SS=sec, and sss=millisec. It "wraps" after 49.710 days.
Error 1695 occurred at disk power-on lifetime: 6852 hours (285 days + 12
hours)
When the command that caused the error occurred, the device was in an
unknown state.
After command completion occurred, registers were:
ER ST SC SN CL CH DH
-- -- -- -- -- -- --
40 51 01 dc 63 8a e0 Error: UNC 1 sectors at LBA = 0x008a63dc = 9069532
Commands leading to the command that caused the error were:
CR FR SC SN CL CH DH DC Powered_Up_Time Command/Feature_Name
-- -- -- -- -- -- -- -- ---------------- --------------------
25 00 01 dc 63 8a e0 08 01:56:33.040 READ DMA EXT
25 00 02 db 63 8a e0 08 01:56: 32.032 READ DMA EXT
25 00 03 da 63 8a e0 08 01:56:30.800 READ DMA EXT
25 00 01 dc 63 8a e0 08 01:56:29.568 READ DMA EXT
25 00 02 db 63 8a e0 08 01:56:28.320 READ DMA EXT
Error 1694 occurred at disk power-on lifetime: 6852 hours (285 days + 12
hours)
When the command that caused the error occurred, the device was in an
unknown state.
After command completion occurred, registers were:
ER ST SC SN CL CH DH
-- -- -- -- -- -- --
40 51 02 db 63 8a e0 Error: UNC 2 sectors at LBA = 0x008a63db = 9069531
Commands leading to the command that caused the error were:
CR FR SC SN CL CH DH DC Powered_Up_Time Command/Feature_Name
-- -- -- -- -- -- -- -- ---------------- --------------------
25 00 02 db 63 8a e0 08 01:56: 32.032 READ DMA EXT
25 00 03 da 63 8a e0 08 01:56:30.800 READ DMA EXT
25 00 01 dc 63 8a e0 08 01:56:29.568 READ DMA EXT
25 00 02 db 63 8a e0 08 01:56:28.320 READ DMA EXT
25 00 03 da 63 8a e0 08 01:56: 27.088 READ DMA EXT
Error 1693 occurred at disk power-on lifetime: 6852 hours (285 days + 12
hours)
When the command that caused the error occurred, the device was in an
unknown state.
After command completion occurred, registers were:
ER ST SC SN CL CH DH
-- -- -- -- -- -- --
40 51 02 da 63 8a e0 Error: UNC 2 sectors at LBA = 0x008a63da = 9069530
Commands leading to the command that caused the error were:
CR FR SC SN CL CH DH DC Powered_Up_Time Command/Feature_Name
-- -- -- -- -- -- -- -- ---------------- --------------------
25 00 03 da 63 8a e0 08 01:56:30.800 READ DMA EXT
25 00 01 dc 63 8a e0 08 01:56:29.568 READ DMA EXT
25 00 02 db 63 8a e0 08 01:56: 28.320 READ DMA EXT
25 00 03 da 63 8a e0 08 01:56:27.088 READ DMA EXT
25 00 3d dd 63 8a e0 08 01:56:27.072 READ DMA EXT
Error 1692 occurred at disk power-on lifetime: 6852 hours (285 days + 12
hours)
When the command that caused the error occurred, the device was in an
unknown state.
After command completion occurred, registers were:
ER ST SC SN CL CH DH
-- -- -- -- -- -- --
40 51 01 dc 63 8a e0 Error: UNC 1 sectors at LBA = 0x008a63dc = 9069532
Commands leading to the command that caused the error were:
CR FR SC SN CL CH DH DC Powered_Up_Time Command/Feature_Name
-- -- -- -- -- -- -- -- ---------------- --------------------
25 00 01 dc 63 8a e0 08 01:56: 29.568 READ DMA EXT
25 00 02 db 63 8a e0 08 01:56:28.320 READ DMA EXT
25 00 03 da 63 8a e0 08 01:56:27.088 READ DMA EXT
25 00 3d dd 63 8a e0 08 01:56:27.072 READ DMA EXT
25 00 3e dc 63 8a e0 08 01:56: 25.760 READ DMA EXT
Error 1691 occurred at disk power-on lifetime: 6852 hours (285 days + 12
hours)
When the command that caused the error occurred, the device was in an
unknown state.
After command completion occurred, registers were:
ER ST SC SN CL CH DH
-- -- -- -- -- -- --
40 51 02 db 63 8a e0 Error: UNC 2 sectors at LBA = 0x008a63db = 9069531
Commands leading to the command that caused the error were:
CR FR SC SN CL CH DH DC Powered_Up_Time Command/Feature_Name
-- -- -- -- -- -- -- -- ---------------- --------------------
25 00 02 db 63 8a e0 08 01:56:28.320 READ DMA EXT
25 00 03 da 63 8a e0 08 01:56:27.088 READ DMA EXT
25 00 3d dd 63 8a e0 08 01:56: 27.072 READ DMA EXT
25 00 3e dc 63 8a e0 08 01:56:25.760 READ DMA EXT
25 00 3f db 63 8a e0 08 01:56:24.528 READ DMA EXT
SMART Self-test log structure revision number 1
No self-tests have been logged. [To run self-tests, use: smartctl -t]
SMART Selective self-test log data structure revision number 1
SPAN MIN_LBA MAX_LBA CURRENT_TEST_STATUS
1 0 0 Not_testing
2 0 0 Not_testing
3 0 0 Not_testing
4 0 0 Not_testing
5 0 0 Not_testing
Selective self-test flags (0x0):
After scanning selected spans, do NOT read-scan remainder of disk.
If Selective self-test is pending on power-up, resume after 0 minute
delay.
ubuntu at ubuntu:/proc$
=========================================
sudo fsck.ext3 /dev/hd6
quelques centaines d'erreur de lecture de ce genre :
Erreur de lecture du bloc 753805 (Attempt to read block from filesystem
resulted in short read) lorsque examen en cours des inodes. Ignorer
l'erreur<o>? oui
Forcer la ré-écriture<o>? oui
Erreur de lecture du bloc 753806 (Attempt to read block from filesystem
resulted in short read) lorsque examen en cours des inodes. Ignorer
l'erreur<o>? oui
...
Erreur de lecture du bloc 950276 (Attempt to read block from filesystem
resulted in short read) lorsque examen en cours des inodes. Ignorer
l'erreur<o>? oui
Forcer la ré-écriture<o>? oui
Passe 2 : vérification de la structure des répertoires
L'entrée 'tmp' dans / (2) a un inode effacé/non utilisé 475137.
Effacer<o>? oui
L'entrée ' gaim.mo' dans /usr/share/locale/ar/LC_MESSAGES (65976) a un
inode effacé/non utilisé 71954. Effacer<o>? oui
...
L'entrée 'debconf-updatepo.1.gz' dans /usr/share/man/fr/man1 (66050) a un
inode effacé/non utilisé 73217. Effacer<o>? oui
L'entrée 'locale.alias' dans /usr/share/locale (65787) a un inode
effacé/non utilisé 70793. Effacer<o>? oui
L'entrée 'cups_de.po' dans /usr/share/locale/de (65800) a un inode
effacé/non utilisé 70831. Effacer<o>? oui
...
L'entrée 'mime.types.5.gz' dans /usr/share/man/man5 (66371) a un inode
effacé/non utilisé 70894. Effacer<o>? oui
L'entrée 'printers.conf.5.gz' dans /usr/share/man/man5 (66371) a un inode
effacé/non utilisé 70895. Effacer<o>? oui
L'entrée 'variables.5snmp.gz' dans /usr/share/man/man5 (66371) a un inode
effacé/non utilisé 70904. Effacer<o>? oui
L'entrée 'mib2c.conf.5snmp.gz' dans /usr/share/man/man5 (66371) a un inode
effacé/non utilisé 70905. Effacer<o>? oui
L'entrée 'snmp.conf.5snmp.gz' dans /usr/share/man/man5 (66371) a un inode
effacé/non utilisé 70906. Effacer<o>?
...
=========================================
A votre avis ?
Le disque dur qui est en train de rendre l'âme ?
(les disques durs ont-ils une âme ? Votez par SMS au 3999 .... lol)
Il faut encore que je démonte les câbles, tout secourer, souffler sur les
poussières et réinstaller ? (pas sérieux ça)
marre de ce genre de m...
J'ai déjà eu 3 problèmes de ce genre sur mon propre PC, et j'ai fini par
retirer le SATA et remettre un bon vieux IDE...
et sur ce PC ci, c'est l' IDE (ou la carte mère) qui remet ça !
:-(
Que faire pour être sur de retrouver un PC et disque dur stable ?
Merci
--
Didier
http://didier.misson.net
Plus d'informations sur la liste de diffusion Linux-bruxelles