随机性死机故障分析与排除

随机性故障是计算机使用过程中经常遇到的一种常见故障,由于出现死机的故障不确定,所做操作性质不固定,而且死机发生时,显示的现象也不统一,所以故障发生的范围不易确定,给维修工作带来了一定的难度。

根据大量的维修实例分析总结,随机性死机故障产生的原因主要是以下三个方面:
   一、环境因素
   环境因素对于机器的正常运行有着很大的影响。计算机对环境的要求主要包括:温度、湿度、电网干扰、电磁冲击、外界振动冲击、静电、接地系统、供电系统等方面内容。其中尤以温度、湿度、静电、接地系统、供电系统对机器的正常运行影响最大。由于机器工作环境,如灰尘、潮湿引起芯片间线路短路或插拔件接触不良,都有可能引起系统死机。根据实际维修统计,环境因素造成的随机性故障占故障总数的10%左右。
   二、软件原因
   软件系统引起的随机性死机包括两种情况。一是病毒破坏,虽然有时可以通过冷、热启动再次启动机器,但运行不久又会死机。二是应用软件与操作系统不完全兼容,它们之间有冲突或者与硬件固有特性发生冲突,这种死机大多没有键盘响应,只能通过冷启动再次启动机器。
   对于软件原因造成的随机性故障的检查方法是,可以使用干净的引导盘重新引导机器后,再运行杀毒软件清除病毒。对于应用软件与操作系统有冲突,建议采用修改程序配置与改变机器硬件配置相结合的方法解决。根据实际维修统计,软件原因造成的随机性故障占故障总数的20%左右。
   三、硬件原因
   硬件系统引起死机,主要是由于机器内部元件质量、兼容性或匹配不当引起的。通常包括:
   1.可插拔芯片接触性故障。主板上有一些可插拔芯片接触不良,这类故障极易发生在CPU芯片、内存芯片以及各种扩展槽上,另外,AGP扩展槽普遍存在插不紧的问题。
   2.芯片工作时序不匹配。在一个电路中如果几个芯片共同完成一个功能,而几个芯片之间的执行速度不匹配,当一个信号在芯片内部通过逻辑变换,传输所需的延时时间比较长,就容易产生时序故障。或时序电路的控制时间关系要求比较严格,偶尔发生时序信号漂移,这种情况最常见于组装的兼容机。此外,由于采用了不同厂家的板卡或芯片也存在不完全兼容的现象,时钟频率过高,也是造成死机的原因。
   3.热稳定性差。所谓的热稳定性差是指机器在开始时运行正常,运行一段时间后,随着芯片温度的上升,开始出现死机。关机后,冷却休息一段时间后开机又可以正常工作,之后又出现死机。其主要原因还是在于元器件本身质量不过关。
   4.芯片驱动能力差。因为每个芯片的扇出值是固定的,在电路设计中要求芯片的输出信号驱动的芯片数必须小于允许的扇出值。如果芯片的扇出值不满足其额定指标,当系统或某个电路连接较多设备时,就会造成芯片工作死机。这种故障经常出现在主板上的I/O接口、内存的地址或数据驱动芯片。
   5.抗干扰能力差。芯片的电源线和地线在印刷电路板上的布线宽度过小,线与线之间距离过近或芯片之间的电平匹配不好,使传输信号有“振荡”或“反射”造成信号干扰,使芯片具有抗干扰能力而引起系统死机。根据实际维修统计,硬件原因造成的随机性故障占故障总数的70%左右,是造成随机性故障的主要原因,也是本文重点介绍的部分。
   四、随机性故障分析与维修方法
   该类故障的检查原则是,首先根据故障现象,推断出故障的性质,然后根据这种推断,利用万用表、逻辑笔、示波器等工具,检查硬件线路上的相应信号是否有随机的干扰或时序漂移等现象,如果有则找到相应的硬件进行维修和更换。
   首先检查是否有接触性故障。在关机状态下取下各种扩展卡,用手指卡住板卡边缘轻轻弯折、敲打,然后在开机通电状态下,用手指按压板卡边缘、主板上的CPU插座、内存条以及各种插头或插座,如果在某个情况下机器可以启动,则说明发生了接触性不良故障。
   如果经反复试验证明不是接触性故障,就要检查是否控制电路的时序故障。重点检查:
   1.系统控制电路芯片。主要是地址总线和数据总线芯片,ALE的地址锁存信号,以及主板上的南、北桥芯片等其它门阵芯片。
   2.系统内存控制电路、驱动电路。主要是RAM的行选通信号RAS、列选通信号CAS、行列地址转换控制信号和内存数据读出驱动、内存芯片速度匹配关系。
   3.系统各种时钟信号电路,主要是SYSCLK、PROCCLK、PCLK、DMACLK。
   通过使用100MHz以上的高频示波器检查上述信号,希望发现某个信号在某一瞬间出现不正常状态,如时序漂移或毛刺等干扰信号,发现后找到相应的芯片进行更换。
   三是热稳定性差是随时性故障的另一种主要的表现形式,随着夏季的到来或超频使用CPU等,这类故障变得越来越频繁。检查时可以使用电吹风距离打开的机箱20厘米~30厘米处进行加热,当机箱内温度上升到60℃~70℃左右时,故障可能开始频繁出现。当机器置于18℃~25℃的空调房间内,如果故障发生率大大降低,则确定是热稳定性差故障。再使用示波器主板上的数据总线、地址总线、控制芯片的进行输出波形的检查,如果发现有明显的干扰信号,则找到对应的芯片进行更换。
   四是信号之间的相互干扰和芯片驱动能力差问题也是造成随机性故障的常见原因之一。在维修中发现,此类故障多产生在74FXX芯片与74LSXX、ALSXX芯片之间。

(0)

相关推荐

  • 随机性死机故障分析与排除

    随机性故障是计算机使用过程中经常遇到的一种常见故障,由于出现死机的故障不确定,所做操作性质不固定,而且死机发生时,显示的现象也不统一,所以故障发生的范围不易确定,给维修工作带来了一定的难度. 根据大量的维修实例分析总结,随机性死机故障产生的原因主要是以下三个方面:    一.环境因素    环境因素对于机器的正常运行有着很大的影响.计算机对环境的要求主要包括:温度.湿度.电网干扰.电磁冲击.外界振动冲击.静电.接地系统.供电系统等方面内容.其中尤以温度.湿度.静电.接地系统.供电系统对机器的正常

  • 打开网络连接就死机

    故障现象 笔者的一位同事将自用的笔记本电脑带回公司,准备连上公司的局域网,结果不知什么原因,没有连上局域网,笔记本电脑的开机速度却变慢了.现在这台笔记本电脑的问题就是感觉开机和运行的速度很慢,而且一打开网络连接就死机.但是通过"Windows任务管理器"查看,发现CPU的使用率只有2%左右,很正常,也没有发现有比较大的程序在系统后台运行. 诊断过程 笔者将该笔记本电脑接上电源.开机.果然觉得速度慢得简直让人难以忍受,本来启动飞快的Windows 2000 Professonal却像是安

  • linux 死机日志分析

    系统出现死机,一般分为两种情况:一是硬件问题:二是软件问题. 一.硬件问题 可以考虑分析以下几点: 1.不要超频CPU,如果已经超频的先回复到原来的频率 虽然平时运行没有问题,但可能在高负载的使用中就会出现不可预料的故障了.特别是linux系统在某些应用上,是可以把硬件的性能发挥到极限的,但这样的硬件运行Windows可能是没有问题的. 2.确认电源供电充足 必须确保在高负载的状态下,电源可以满足负载. 3.使用memtest86检查内存状态 4.恢复BIOS到默认状态 对于服务器,可以使用自带

  • 病毒也是宽带路由器死机的罪魁之一

    问题:两台笔记本都是通过无线网卡和无线宽带路由器上网.最近其中的一笔记本一开IE就会弹出一个奇怪的窗口,接着两台笔记本就都不能上网了,重启宽带路由器后正常使用不超过5分钟,再次不能上网.请问这是怎么回事. 回答:如果排除设置问题的话,建议对两台笔记本进行查杀病毒的处理.特别是打开IE就会自动弹出窗口的那部笔记本,很有可能中了病毒.有些网络病毒会专门攻击宽带路由器的特定端口或者在网络中不断发送广播包.当遇到这样的情况时,宽带路由器会因为负载过重而引起死机掉线等问题.跟据你所描述的,重启后正常使用一

  • 简单几招让你的电脑不再假死机

    死机,相信是很多朋友习以为常的事.一发现死机,我们通常都会直接热启动或按"Reset",但孰不知,有时电脑并未真正死机,只不过是处于一种假死的状态.按下数字键区的"Num Lock"键,如果指示灯有反应,则说明是假死机.那我们该如何处理真.假死机呢? 一.修改注册表,远离假死机困扰 很多假死机是由于运行的程序没有响应造成的.比如你在同一时间打开或启动的程序过多,导致系统资源消耗严重,就会出现程序停止响应的情况,这时我们可以按下"Ctrl+Alt+Del&q

  • 优盘,移动硬盘插入usb或光驱放光盘为什么一卡就死机的正确原因分析

    有朋友问为什么光驱放光盘就会出现卡死现象,其实并没有死机,只是由于光盘的质量不佳或者光驱激光头老化所致.  当光驱在读到光盘的某些不清晰区域时,需要重复尝试,调整光头位置以及功率等以便读取数据,这时候的光驱消耗较多的cpu,往往造成假死机现象. 这个时候只要将光驱中的光盘拿出来,电脑即可回复正常,其实我们经常发现我们插入优盘.移动硬盘也会出现这种情况,这样我们可以格式化下,应该就可以解决为什么光驱放光盘为什么一卡就死机的原因

  • 改改注册表,识破真假死机

    电脑死机,相信大家对此并不陌生.一发现死机,初学电脑的朋友通常都会直接热启动或复位启动,但孰不知,有时电脑并未真正死机,只不过是处于一种假死的状态罢了.按下数字区的"Numlock"键,如果指示灯有反应,则说明是假死机.那么我们如何处理真.假死机呢? 很多假死机是由于运行的程序没有响应造成的(比如:你在同一时间打开或者启动的程序过多,由于系统资源消耗严重,就会产生程序停止响应的情况),这时我们可以按下"Ctrl+Alt+Del" 组合键,在弹出的列表中选定标注为&q

  • Linux系统“死机”时解决方法

    如果问题能够再现,那么问题已经解决 80% 了.对于操作系统核心而言,如果有问题的再现方法,那么可以说是已经解决 99% 了.经常遇到的问题是系统可以正常运行一段时间,然后死机.如果不好再现问题,那么只有根据死机现场遗留的东西来进行分析了. 如果系统没有死干净,比如磁盘中断和文件系统是好的,那么也许能有日志信息保留在文件中,不过这样的好运气我是从来没有遇到过的.如果键盘中断还能响应 (按下Num Lock,可以看见键盘小灯亮灭),那么运气就算是足够好了,这时可以祭出 sysrq 大法,同时按下 

  • 导致计算机系统“死机”的原因及其预防方法

    如今的计算机已经接近全面普及的程度了,它给人们在工作和学习上提供了极大的方便,不过,计算机的"死机"对于普通的计算机用户来说,却成为了一个解不开.挣不脱的烦 恼.每当在计算机开机时.或启动操作系统时.或使用一些应用程序时.或正准备退出操作系统时,"死机"这一头"猛兽"随时都有可能迎面扑来.那么,怎么做才能避免计算机"死机"的烦恼呢?下面,笔者就根据导致"死机"的原因和预防的方法分为几点给大家介绍一下,希望下

  • Windows 2003 SP2上QQ死机的多种解决方案

    MS最近低调发布了Windows 2003 Server 的sp2补丁,但是安装完成后,一个很严重的问题就出现了,一旦运行QQ就会出现死机,或者几分钟后就死机,看来这个SP2在安全性方面增加了不少东西啊. 网上找了一下,SP2可能会安装一半时出现错误,这个问题的原因应该是一个ADAM 的SP1没有安装,只要从网上下一个安装一下就可以了,所以,在安装时,尽量先安装这个ADAM SP1. 关于这个QQ死机的问题,原因是QQ的安全键盘组件引起. 解决方法一手动删掉QQ的键盘安全组件,关闭QQ,删除QQ

随机推荐