织梦CMS - 轻松建站从此开始!

罗索

当前位置: 主页>杂项技术>PC常识>

坏道让人伤心 硬盘缺陷探秘

罗索客 发布于 2005-05-24 10:22 点击:次 
软件大小:KB 授权方式:免费软件 软件类别:DOS-文章 应用平台:Win 9x/ME/NT/2000 界面预览:无 加入时间:2003-8-12 下载浏览:3563/7848 推荐等级:★★★★★ 开 发 商:作者 / 厂商主页 软件其他:评论投票 报告错误 软件介绍: 硬盘是目前PC系统中最主要的存储设
TAG:

软件大小:  KB
授权方式:  免费软件
软件类别:  DOS-文章
应用平台:  Win 9x/ME/NT/2000
界面预览:  无
加入时间:  2003-8-12
下载浏览:  3563/7848
推荐等级:  ★★★★★

开 发 商:  作者 / 厂商主页

软件其他:  评论投票 报告错误

软件介绍:

    硬盘是目前PC系统中最主要的存储设备,同时硬盘是PC系统中出故障率
最高的部
件。用户在使用硬盘过程中,硬盘出现故障怎么办呢?如果还在质保期内,
当然是尽量
找到销售商要求保修。但现在大多数IDE硬盘质保期只有一年,而大多数用
户都希望一
个硬盘能使用三年以上。如果质保期过后硬盘出了故障,就得考虑更换或对
它进行修
理。

  笔者这几年来一直从事硬盘维修工作,经常与国内外的同行交流,查阅
过大量的外
文专业资料,研究使用过多种专业的硬盘修复工具,成功修复了近万个硬
盘。在这里,
笔者与读者探讨一些硬盘缺陷及其修复原理,同时介绍并解释一些专业修复
硬盘软件中
常用到的概念。但笔者暂不探讨在各种操作系统下硬盘中的数据结构问题及
数据恢复问
题,而是直接探讨硬盘本身的缺陷问题。

  一、缺陷的分类

  如果经检测发现某个硬盘不能完全正常工作,则称这个硬盘是“有缺陷
的硬盘”
(Defect Hard Disk)。

  根据维修经验,笔者将硬盘的缺陷分为六大类

  ①坏扇区(Bad sector),也称缺陷扇区(Defect sector)
  ②磁道伺服缺陷(Track Servo defect)?
  ③磁头组件缺陷(Heads assembly defect)
  ④系统信息错乱(Service information destruction)
  ⑤电子线路缺陷(The board of electronics defect)
  ⑥综合性能缺陷(Complex reliability defect)

  1.坏扇区(也称缺陷扇区)

  指不能被正常访问或不能被正确读写的扇区。一般表现为:高级格式化
后发现有
“坏簇(Bad Clusters);用SCANDISK等工具检查发现有“B”标记;或用
某些检测工
具发现有“扇区错误提示”等。

  一般每个扇区可以记录512字节的数据,如果其中任何一个字节不正
常,该扇区就
属于缺陷扇区。每个扇区除了记录512字节的数据外,另外还记录有一些信
息:标志信
息、校验码、地址信息等,其中任何一部分信息不正常都导致该扇区出现缺
陷。

  多数专业检测软件在检测过程中发现缺陷时,都有类似的错误信息提
示,常见的扇
区缺陷主要有几种情况:

①校验错误(ECC uncorrectable errors,又称ECC错误)。系统每次在往
扇区中写数
据的同时,都根据这些数据经过一定的算法运算生成一个校验码
(ECC=Error
Correction Code),并将这个校验码记录在该扇区的信息区内。以后从这
个扇区读取
数据时,都会同时读取其校检码,并对数据重新运算以检查结果是否与校检
码一致。如
果一致,则认为这个扇区正常,存放的数据正确有效;如果不一致,则认为
该扇区出
错,这就是校验错误。这是硬盘最主要的缺陷类型。导致这种缺陷的原因主
要有:磁盘
表面磁介质损伤、硬盘写功能不正常、校验码的算法差异。

  ②IDNF错误(sector ID not found),即扇区标志出错,造成系统在
需要读写时
找不到相应的扇区。造成这个错误的原因可能是系统参数错乱,导致内部地
址转换错
乱,系统找不到指定扇区;也有可能是某个扇区记录的标志信息出错导致系
统无法正确
辨别扇区。

  ③AMNF错误(Address Mark Not Found),即地址信息出错。一般是由
于某个扇区
记录的地址信息出错,系统在对它访问时发现其地址信息与系统编排的信息
不一致。

  ④坏块标记错误(Bad block mark)。某些软件或病毒程序可以在部分
扇区强行写
上坏块标记,让系统不使用这些扇区。这种情况严格来说不一定是硬盘本身
的缺陷,但
想清除这些坏块标记却不容易。

  2.磁道伺服缺陷

  现在的硬盘大多采用嵌入式伺服,硬盘中每个正常的物理磁道都嵌入有
一段或几段
信息作为伺服信息,以便磁头在寻道时能准确定位及辨别正确编号的物理磁
道。如果某
个物理磁道的伺服信息受损,该物理磁道就可能无法被访问。这就是“磁道
伺服缺
陷”。一般表现为,分区过程非正常中断;格式化过程无法完成;用检测工
具检测时,
中途退出或死机,等等。

  3.磁头组件缺陷

  指硬盘中磁头组件的某部分不正常,造成部分或全部物理磁头无法正常
读写的情
况。包括磁头磨损、磁头接触面脏、磁头摆臂变形、音圈受损、磁铁移位
等。一般表现
为通电后,磁头动作发出的声音明显不正常,硬盘无法被系统BIOS检测到;
无法分区格
式化;格式化后发现从前到后都分布有大量的坏簇,等等。

  4.系统信息错乱

  每个硬盘内部都有一个系统保留区(service area),里面分成若干模
块保存有许
多参数和程序。硬盘在通电自检时,要调用其中大部分程序和参数。如果能
读出那些程
序和参数模块,而且校验正常的话,硬盘就进入准备状态。如果某些模块读
不出或校验
不正常,则该硬盘就无法进入准备状态。一般表现为,PC系统的BIOS无法检
测到该硬盘
或检测到该硬盘却无法对它进行读写操作。如某些系列硬盘的常见问题:美
钻二代系列
硬盘通电后,磁头响一声,马达停转;Fujitsu MPG系列在通电后,磁头正
常寻道,但
BIOS却检测不到;火球系列,系统能正常认出型号,却不能分区格式化;
Western
Digital的EB、BB系列,能被系统检测到,却不能分区格式化,等等。

  5.电子线路缺陷

  指硬盘的电子线路板中部分线路断路或短路,某些电气元件或IC芯片损
坏等。有部
分可以通过观察线路板发现缺陷所在,有些则要通过仪器测量后才能确认缺
陷部位。一
般表现为硬盘在通电后不能正常起转,或者起转后磁头寻道不正常,等等。

  6.综合性能缺陷

  有些硬盘在使用过程中部分芯片特性改变;或者有些硬盘受震动后物理
结构产生微
小变化(如马达主轴受损);或者有些硬盘在设计上存在缺陷……最终导致
硬盘稳定性
差,或部分性能达不到标准要求。一般表现为,工作时噪音明显增大;读写
速度明显太
慢;同一系列的硬盘大量出现类似故障;某种故障时有时无等等。

二、厂家处理缺陷的方式

  用户在购买硬盘时,一般都通过各种工具检测硬盘没有缺陷后才会购
买。而且,在
质保期内可以找销售商将硬盘退回厂家修理。那么,厂家如何保证新硬盘不
会被检测到
缺陷呢?返修的硬盘又如何处理缺陷呢?首先,让我们来认识硬盘工厂的一
些基本处理
流程:

  1.在生产线上装配硬盘的硬件部分,用特别设备往盘片写入伺服信号
(Servo
write)。

  2.将硬盘的系统保留区(service area)格式化,并向系统保留区写入
程序模块和
参数模块。系统保留区一般位于硬盘0物理面的最前面几十个物理磁道。写
入的程序模
块一般用于硬盘内部管理,如低级格式化程序、加密解密程序、自监控程
序、自动修复
程序等等。写入的参数多达近百项:如型号、系列号、容量、口令、生产厂
家与生产日
期、配件类型、区域分配表、缺陷表、出错记录、使用时间记录、
S.M.A.R.T表等等,
数据量从几百KB到几MB不等。有时参数一经写入就不再改变,如型号、系列
号、生产时
间等;而有些参数则可以在使用过程中由内部管理程序自动修改,如出错记
录、使用时
间记录、S.M.A.R.T记录等。也有些专业的维修人员可以借助专业的工具软
件,随意读
取、修改写入硬盘中的程序模块和参数模块。

  3.将所使用的盘片表面按物理地址全面扫描,检查出所有的缺陷磁道和
缺陷扇区,
并将这些缺陷磁道和缺陷扇区按实际物理地址记录在永久缺陷列表(P-list

Permanent defect list)中。这个扫描过程非常严格,能把不稳定不可靠
的磁道和扇
区也检查出来,视同缺陷一并处理。现在的硬盘密度极高,盘片生产过程再
精密也很难
完全避免缺陷磁道或缺陷扇区。一般新硬盘的P-list中都有少则数十,多则
上万个缺陷
记录。P-list是保留在系统保留区中,一般用户是无法查看或修改的。有些
专业的维修
人员借助专业的工具软件,可以查看或修改大部分硬盘中的P-list。

  4.系统调用内部低级格式化程序,根据相应的内部参数进行内部低级格
式化。在内
部低级格式化过程中,对所有的磁道和扇区进行编号、信息重写、清零等工
作。在编号
时,采用跳过(skipped)的方法忽略掉记录在P-list中的缺陷磁道和缺陷
扇区,保证
以后用户不会也不能使用到那些缺陷磁道和缺陷扇区。因此,新硬盘在出售
时是无法被
检测到缺陷的。如果是返修的硬盘,一般就在厂家特定的维修部门进行检测
维修。

小知识:什么是硬盘的磁道和扇区?磁道是磁盘一个面上的单个数据存储圆
圈。如果将
磁道作为一个存储单元,从数据管理效率来看实在是太低了,因此,磁道被
分成若干编
上号的区域,称之为扇区。这些扇区代表了磁道的分段(如图)。在PC系统
中,通过标
准格式化的程序产生的扇区容量都为512字节。这里大家需注意的是“扇
区”与“簇”
的关系,“簇”是操作系统在读或写一个文件时能处理的最小磁盘单元,一
个簇等于一
个或多个扇区。

三、硬盘缺陷的处理

  如果不在硬盘工厂中,对普通用户或维修人员来说,又如何处理硬盘的
缺陷呢?前
面我们把硬盘的缺陷分为六大类,不同类型的缺陷用不同的处理方法。

  1.对于综合性能缺陷,一般涉及到稳定性问题,用户随时有丢失数据的
危险,可以
说是“用之担惊,弃之可惜”。维修人员很难从根本上解决问题,建议用户
还是趁早更
换硬盘。

  2.对于磁头组件缺陷,解决办法是更换磁头组件,这对设备及环境要求
较高,维修
成本也很高。除非是要求恢复其中的数据,否则不值得进行修复。有条件的
维修公司可
以在百级净化室中更换硬盘的磁头组件,对数据进行拯救。

  3.对于线路缺陷,一般要求维修人员有电子线路基础,要有测试线路的
经验和焊接
芯片的设备,当然还要有必需的配件以备更换。目前许多专业维修硬盘的公
司都有条件
解决这类缺陷。对普通用户而言,最简单的判别和解决办法是找一个相同的
正常线路板
换上试试。

  4.对于系统信息错乱,需要有专业的工具软件才能解决。首先要找个与
待修硬盘参
数完全相同的正常硬盘,读出其内部所有模块并保存下来;检查待修硬盘的
系统结构,
查到出错的模块,并将正常模块的参数重新写入。笔者用这个方法成功地修
复了数以千
计有这种缺陷类型的硬盘,而且一般不会破坏原有数据。要想写某系列硬盘
的系统信
息,相应的工具软件必须有严格针对性;该硬盘的CPU专用指令集;该硬盘
的Firmware
结构;内部管理程序和参数模块结构。一般只有硬盘厂家才能编写这样的专
业工具软
件,而且视为绝密技术,不向外界提供。但也有一些专业的硬盘研究所研究
开发类似的
专业工具软件,一般要价很高而且很难买到。

  5.对于伺服缺陷,也要借助于专业工具。相应的专业工具可以通过重写
来纠正伺服
信息,解决部分磁道伺服缺陷。如果有部分无法纠正,则要对盘片进行物理
磁道扫描找
出有伺服缺陷的磁道,添加到P-list(或另外的专门磁道缺陷列表)中。然
后,运行硬
盘内部的低级格式化程序。这段程序能自动根据需要调用相关的参数模块,
自动完成硬
盘的低格过程,不需要PC系统的干预。

  坏扇区是最常见的缺陷类型,下面笔者着重论述。

四、坏扇区的修复原理

  按“三包”规定,如果硬盘在质保期内出现缺陷,商家应该为用户更换
或修理。现
在大容量的硬盘出现一个坏扇区的概率实在很大,如果全部送修的话,硬盘
商家就要为
售后服务忙碌不已了。很多硬盘商家都说,硬盘出现少量坏扇区往往是病毒
作怪或某些
软件造成的,不是真正的坏扇区,只要运行硬盘厂家提供的某些软件,就可
以纠正了。
到底是怎么回事呢?从前面对坏扇区的说明来看,坏扇区有多种可能的原
因,修复的方
法也有几种:

  1.通过重写校验码、标志信息等可以纠正一部分坏扇区。现在硬盘厂家
都公开提供
有一些基本的硬盘维护工具,如各种版本的DM、POWERMAX、DLGDIAG等,其
中都包括有
这样的功能项:Zero fill(零填充)或Lowlevel format(低级格式化)。
进行这两项
功能都会对硬盘的数据进行清零,并重写每个扇区的校验码和标志信息。如
果不是磁盘
表面介质损伤的话,大部分的坏扇区可以纠正为正常状态。这就是常听说的
:“逻辑坏
扇区可以修复”的道理。

  2.调用自动修复机制替换坏扇区。为了减少硬盘返修的概率,硬盘厂商
在硬盘内部
设计了一个自动修复机制?Automatic Reallcation或Automatic
Reassign?。现在生
产的硬盘都有这样的功能:在对硬盘的读写过程中,如果发现一个坏扇区,
则由内部管
理程序自动分配一个备用扇区来替换该扇区,并将该扇区物理位置及其替换
情况记录在
G-list(增长缺陷表,Grown defects list?中。这样一来,少量的坏扇区
有可能在使
用过程中被自动替换掉了,对用户的使用没有太大的影响。也有一些硬盘自
动修复机制
的激发条件要严格一些,需要运行某些软件来检测判断坏扇区,并发出相应
指令激发自
动修复功能。比如常用的Lformat(低格)?DM中的Zero fill,Norton中的
Wipeinfo和
校正工具,西数工具包中的wddiag,IBM的DFT中的Erase,还有一些半专业
工具如:
HDDspeed、MHDD、HDDL、HDDutility等(大家可以上网搜索下载)。这些工
具之所以能
在运行过后消除了一些坏扇区,很重要的原因就是这些工具可以在检测到坏
扇区时激发
自动修复机制。如果读者能查看G-list就知道,这些“修复工具”运行前
后,G-list记
录有可能增加一定数量。如:用HDDspeed可以查看所有Quantum Fireball系
列的P-list
和G-list;MHDD可以查看IBM和FUJITSU的P-list和G-list。

  当然,G-list的记录不会无限制,所有硬盘的G-list都会限定在一定数
量范围内。
如火球系列限度是500条,美钻二代的限度是636条,西数BB的限度是508
条,等等。超
过限度,自动修复机制就不能再起作用。这就是为何少量的坏扇区可以通过
上述工具修
复,而坏扇区多了不能通过这些工具修复。

  3.用专业软件将缺陷扇区记录在P-list中,并进行内部低级格式化。用
户在使用硬
盘时,是不能按物理地址模式来访问硬盘的。而是按逻辑地址模式来访问。
硬盘在通电
自检时,系统会从系统保留区读取一些特定参数(与内部低级格式化时调用
的参数有密
切关系)存在缓冲区里,用作物理地址与逻辑地址之间转换的依据。有些专
业软件可以
将检测到的坏扇区的逻辑地址转换为对应的物理地址,直接记录在P-list
中,然后调用
内部低级格式化程序进行低级格式化。这样可以不受G-list的限制,能修复
大量的坏扇
区,达到厂家修复的效果。

五、关于“坏道”的一点补充

  “坏道(Bad track)”这个概念源于十多年前小容量硬盘(如ST506接
口、100MB
以下)。当时的硬盘内部没有什么系统保留区,也就没有P-list或G-list。
出厂前,厂
家就扫描硬盘中存在坏扇区的磁道,并将其位置记录在一张小表格中,贴在
硬盘外壳
上,注明“Bad track list”,即常说的“坏道表”。而“坏道表”上就列
出某磁头某
柱面的磁道是坏磁道,这就是我们常听人说的“坏道”。当时所有的硬盘在
第一次使用
前都要求做低级格式化(Low level format,简称“低格”),在使用过程
中也可以根
据需要做低级格式化。在对这个硬盘进行低级格式化前(如用ADM、低版本
DM、早期主
板中自带的低格工具等),要将坏道表中记录都填入,或用工具自动扫描所
有坏道,然
后才进行低级格式化过程。低格过程中,低格程序对所有磁道按一定的规律
进行编号,
同时将前面记录或扫描到的坏道排除在外,即“跳过(Skipped)”那些位
置,对用户
来说可以算是“修好”了“坏道”。而如果哪个用户轻易对硬盘进行低格,
却没有登记
坏道,那么低格会令以前曾“跳过”的坏道一个个又重新显现出来,这就是
为什么当时
人们常说低格会令硬盘增加坏道的原因。

  那么,现在笔者为什么不用“坏道”概念而用“缺陷”概念呢?以前的
老硬盘,通
过低格来修复,只要某磁道中出现一个坏扇区,该磁道就算“坏磁道(Bad
Track)”,修复时就整个磁道所有扇区一起“跳过(skipped)”。所
以,坏磁道和
坏扇区没有区别开来,一起被称为“坏道”也还算贴切。而现在的硬盘,每
个磁道划分
为数百上千个扇区,不能因为有一个坏扇区就丢掉整个磁道。而且有些硬盘
出厂前
P-list就记录数千个坏扇区,如果丢掉数千个磁道(意味道要丢掉数GB的空
间)就太浪
费了。而现在的硬盘不同的缺陷有不同的表现,不同的原因,修复方法也各
不相同。如
果继续用“坏磁道”或“坏道”来概括多种缺陷,很明显词不达意。

作者简介:

周尚战(网名:高朋),广西人,硬盘修复专业人士,长期从事硬盘驱动器
的维修及个
人电脑用户数据恢复工作,具有丰富的硬盘修复经验。

郑信武(网名:Awu):存储在线(http://www.stol.com.cn)CEO,曾是国
内知名的垂
直硬件资讯网站硬盘地带(http://www.pchdd.com)的创立者。长期从事硬
盘驱动器及
企业存储系统的应用研究工作 (iwgh)
本站文章除注明转载外,均为本站原创或编译欢迎任何形式的转载,但请务必注明出处,尊重他人劳动,同学习共成长。转载请注明:文章转载自:罗索实验室 [http://www.rosoo.net/a/200505/2096.html]
本文出处: 作者:iwgh
顶一下
(0)
0%
踩一下
(0)
0%
------分隔线----------------------------
发表评论
请自觉遵守互联网相关的政策法规,严禁发布色情、暴力、反动的言论。
评价:
表情:
用户名: 验证码:点击我更换图片
栏目列表
将本文分享到微信
织梦二维码生成器
推荐内容