(1)观察法。
通过人的感官观察服务器各部件是否有故障,例如是否听到异常声音,是否闻到焦糊味芯片或元件是否有烧焦的痕迹,板卡是否有松动或一端翘起的现象,数据线和电源线是否连接正常等。
(2)测量法
用万用表测量电源输入、输出电压是否严重偏离正常值。
(3)替换法
替换法是服务器故障检测中运用得适合为广泛的一种方法,包含以下两方面的含义:
①将故障服务器中推测的故障部件用相同类型的正常部件替换,如果原来的故障消失了(并不一定能正常工作),则可证实该部件确实有故障。
②用推测的故障部件替换正常服务器的相应部件,如果服务器不能正常运行了,则可更进步证实该部件确实已经损坏
(4)插拔法
插拔法包含两方面的含义:一是逐步插入法,二是逐步拔下法。有两种应用途径
①逐步插入或逐步拔下各部件的电源供电插头,如果故障现象有变化,则说明刚插入或拔下的部件与故障有关。
②逐步插入和逐步拔下主机内各板卡或部件,如果故障现象有变化,则说明刚插入或拔下的板卡或部件与服务器有关。
(5)比较法。
将故障服务器与另一台具有相同配置且装有相同操作系统和应用软件的服务器的运行情进行比较,根据两者的差异判断出故障点。例如,如果怀疑硬盘主引导记录(MBR,MainBoot record)损坏,可以找另一块相冋容量和相冋分区大小的硬盘来对比即可确认。
(6)适合小系统法
所谓“适合小系统”是指只保留电源、主板、CPU、内存、显示卡,而把其他外设和扩展板卡去掉。适合小系统法的基本思路是:先试验适合小系统的服务器的状态,如果适合小系统的服务器也是同样的故障现象,说明故障与电源、主板、CPU、内存、显示卡等设备有关系如果适合小系统的服务器屏幕上有显示,说明故障与适合小系统之外的其他板卡或部件有关系可能是这些设备有损坏,也可能是这些设备与适合小系统中的某一设备不兼容。
(7)根据故障提示信息
在进行服务器系统设计时,为了便于故障诊断,系统会用声音、文字和数字代码等提示信息将很多的故障类型反映出来。掌握这些提示信息的含义就能很快确定故障点。
(8)查杀病毒。
病毒不但能引起软件故障,还会引起硬件故障,很多时候,通过査杀病毒就有可能排除故障。
(9)检查并修正CMOS设置
很多故障是由于CMOS设置不当引起的,通过检查并更正CMOS设置就可能排除故障。
(10)重装软件。
很多服务器故障,特别是软件类故障,重新安装操作系统、驱动程序或应用程序即可排。
(11)利用工具软件进行检测和修复。
很多工具软件可以对服务器各部件的工作状态进行检测,直接给出故障提示信息;另外一些工具软件还能够修复相关故障。如 QAplus、 Pqmagic(分区魔法师)、 Diskedit等等。
(12)服务器启动过程分析法
服务器从加电到正常使用需要经历一系列的步骤(加电、加电自检、引导系统等),每一步都涉及到特定的硬件或软件,如果哪一步出故障,则下一步的工作将无法正常进行。分析故障现象所处启动或运行过程的阶段,是定位故障点的一种很重要的方法。