网络故障的分类
根据网络故障的性质把网络故障分为硬件故障与软件故障,也可以根据网络故障的对象分为线路故障、路由故障和主机故障。
1、按网络故障的性质分类
(1)、硬件故障: 硬件故障指的是设备或线路损坏、插头松动、线路受到严重电磁干扰等情况。
(2)、软件故障:软件故障中最常见的情况就是配置错误,就是指因为网络主机或网络设备的配置原因而导致的网络异常或故障。配置错误可能是主机、交换机或路由器端口参数设定有误,或路由器路由配置错误以至于路由循环或找不到远端地址,或者是路由掩码设置错误等。比如,同样是网络中的线路故障,该线路没有流量,但又可以ping通线路的两端端口,这时就很有可能是路由配置错误了。遇到这种情况,我们通常用“路由跟踪程序”(在不同系统中的路由跟踪命令并不相同,在Windows环境下使用tracert命令,在Linux或Unix下使用traceroute命令,在Cisco路由器中使用trace命令),它和ping类似,最大的区别在于路由跟踪程序是把端到端的线路按线路所经过的路由器分成多段,然后每段返回响应与延迟。如果发现在路由跟踪程序的结果中某一段之后。两个IP地址循环出现,这时,一般就是线路远端把端口路由又指向了线路的近端,导致IP包在该线路上反复传递。幸好路由跟踪程序可以检测到哪个路由器之前都能正常响应,到哪个路由器就不能正常响应了。这时只需要更改远端路由器的端口配置,就能恢复线路正常了。
另一类软件故障就是一些重要进程或端口关闭,以及系统的负载过高。比如也是线路中断,没有流量,用PING命令发现线路端口不同,检查发现该端口处于down的状态,这就说明该端口已经关闭,因此导致故障。这时只需要重新启动端口,就可以恢复线路的连通了。还有一种常见情况是路由器的负载过高,表现为路由器CPU温度太高、CPU利用率太高,以及内存剩余太少等,如果因此影响网络服务质量,最直接也是最好的办法就是——更换路由器,当然换个好点的。
2.、按网络故障的对象分类
(1)、线路故障:线路故障最常见的情况就是线路不通,诊断这种情况首先检查该线路上流量是否还存在,然后用ping命令检查线路远端的路由器端口能否响应,用traceroute命令检查路由器配置是否正确,然后找出问题逐个解决。
(2)、路由器故障:线路故障中的很多情况都涉及到路由器,因此也可以把一些线路故障归结为路由器故障。检测路由器故障,需要易用MIB变量流览器,用它收集路由器的路由表、端口流量数据、计费数据、路由器CPU的温度、负载以及路由器的内存余量等数据。通常情况下网络管理系统有专门的管理进程不断地检测路由器的关键数据,并及时给出报警。
(3)主机故障:主机故障常见的现象就是主机的配置不当。例如主机配置的IP地址与其它主机冲突,或IP地址根本就不存在子网范围内,由此导致主机无法连通。主机的另一故障就是安全故障。
网络故障的分层诊断技术
(1)、物理层及其诊断: 物理层是OSI分层结构体系中最基础的一层,它建立在通信媒体的基础上,实现系统和通行媒体的物理接口,为数据链路实体之间进行透明传输,为建立、保持和拆除计算机和网络时间的物理连接提供服务。物理层的故障主要表现在设备的物理连接方式是否恰当,连接电缆是否正确。确定路由器端口物理连接是否完好的非常好的方法是使用SHOW INTERFACE命令,检查每个端口的状态,结合屏幕输出信息,查看端口状态、协议建立状态和EIA状态。
(2)、数据链路层及其诊断:数据链路层的主要任务是使用网络层无须了解物理层的特征而获得可靠的传输。数据链路层为通过链路层的数据进行封装和拆封装、差错检测和一定的校正操作,并协调共享介质。查找和排除数据链层的故障,需要查看路由器的配置。
(3)、网络层及其诊断:网络层提供建立、保持和释放网络层连接的手段,包括路由选择、流量控制、传输确认、中断、差错及故障恢复等。排除网络层故障的基本方法是沿着从源到目标的路径,查看路由器路由表,同时检查路由器接口的IP地址。如果路由没有在路由表中出现,应该通过检查来确定是否已经输入适当的静态路由、默认路由或者动态路由。然后手工配置一些丢失的路由,或者排除一些动态路由选择过程的故障。