|
随着计算机的广泛应用和网络的日趋流行,功能独立的多个计算机系统互联起来,形成日渐庞大的网络系统。计算机网络系统的稳定运转,已与功能完善的网络软件密不可分。计算机网络系统,就是利用通讯设备和线路,将地理位置不同的信息交换方式及网络操作系统等共享,包括硬件资源和软件资源的共享。因此,如何有效地做好单位内的计算机网络的日常维护工作,确保其安全稳定地运行,是网络运行维护人员的重要工作。在排除比较复杂网络的故障时,常常需要从多种角度测试和分析故障的现象,确定故障点。
一、分析模型和方法
1.七层的网络结构分析方法
从网络的七层结构的定义和功能上逐一进行分析和排查,这是传统的且最基础的分析和测试方法。其中,有自下而上和自上而下两种思路。自下而上,即从物理层的链路开始检测,直到应用;自上而下,即从应用协议中捕捉数据包,分析数据包统计和流量统计信息,获得有价值的资料。
2.网络连接结构的分析方法
从网络的连接构成来看,大致可以分成客户端、网络链路、服务器端三个模块。
(1)客户端。客户端具备网络的七层结构,也会出现从硬件到软a件、从驱动到应用程序、从设置错误到病毒等的故障问题。所以,在分析和测试客户端的过程中,要有大量的背景知识,有时PC的发烧经验也会有所帮助;也可以在实际测试过程中询问客户端的用户,分析他们反映的问题是个性还是共性,将有助于对客户端的进一步检测作出决定。
(2)网络链路。来自网络链路的问题,通常需要网管、现场测试仪,甚至需要依靠协议分析仪帮助确定问题的性质和原因。对于这方面的问题分析,需要有坚实的网络知识和丰富的实践经验。有时,实践经验会决定排除故障的时间。
(3)服务器端。在分析服务器端的情况时,更需要有网络应用的丰富知识,了解服务器的硬件性能及配置情况、系统性能及配置情况、网络应用及对服务器的影响情况。
3.工具型分析方法
工具型分析方法,有强大的各种测试工具和软件。它们的自动分析,能快速地给出网络的各种参数甚至是故障的分析结果。这对解决常见网络故障非常有效。
4.综合及经验型分析方法
这需要依靠时间、错误和成功经验的积累。大多数的网络维护工作人员,在工作中多采用这个方法,再依靠网管和测试工具迅速定位网络的故障。
二、计算机无法上网的故障
1.某台联网计算机出现无法上网的故障
首先,要确定该计算机的网卡安装是否正确,是否存在硬件故障以及网络配置是否正确。实际工作中,一般采用Ping本机的回送地址(127.0.0.1)判断网卡硬件安装和TCPIP协议的正确性。如果能Ping通,即说明这部分没有问题。如果出现超时情况,则要检查计算机的网卡是否与机器上的其他设备存在中断、冲突的问题。通过查看系统属性中的设备管理器(查看是否在网络适配器的设备前面有黄色惊叹号或红色叉号),如有则说明硬件的驱动程序没有安装成功,可删除后重新安装。另外,要确保TCPIP协议安装的正确性,且要绑定在所安装的网卡上。如果重新安装后还是Ping不通回送地址,最好换一块网卡。由于在局域网中划分了VLAN,连在不同VLAN中的计算机都有各自不同的IP地址、子网掩码和网关。在机器的网络属性中,设定的IP地址等数据必须与连接的VLAN相匹配,否则将出现网络不通的情况。
确保计算机的硬件设备和网络配置正确后,就要查看计算机与交换机之间的双绞线、交换机的RJ45端口或交换机的配置是否有问题。这时,要Ping上网计算机所在VLAN的网关;不通的话,就要再分段检查以上所提到的各项环节。最简单的方法是检查双绞线,用线缆测试仪检测双绞线是否断开。如果双绞线没有问题,就要查看交换机的端口。交换机每一个端口都有状态指示灯,所以,询问一下其它网管人员就可以排除。交换机的参数配置表也是网络管理员必备的资料之一,且随着网络用户的变化,要不断修改。检测到这时,如果端口指示灯不亮,就说明只可能是端口损坏了,把跳线接到正常使用的端口上排除其它原因,确定是端口问题。
2.一批联网计算机出现无法上网的故障
对于同时有一批计算机上不了网的故障,首先要找到这些计算机的共性。如果这些计算机属于同一VLAN,且属于计算机分别连接于不同的楼层交换机,那么,检查一下路由器上是否有acl限制。在路由器上对该VLAN的配置是否正确,路由协议(如OSPF协议)是否配置正确。如果这些计算机属于同一交换机,则应到机房检查该交换机是否有电源松落情况,或该交换机CPU负载率是否很高,与上一级网络设备的链路是否正常。
通常某交换机连接的所有电脑都不能正常与网内其他电脑通讯,是典型的交换机死机现象,可以通过重新启动交换机的方法解决。如果重新启动后故障依旧,则检查一下交换机连接的所有电脑,看逐个断开连接的每台电脑的情况,慢慢定位到某个故障电脑,会发现多半是某台电脑上的网卡故障导致的。
三、故障定位及排除的常用方法
1.告警性能分析法
通过网管获取告警和性能信息进行故障定位。笔者单位使用了Siteview网络网管,可以对单位内的网络设备进行管理。因此,需要多观察各设备CPU负载率和各线路的流量。当有人反映不能连接至网络或网速很慢时,可通过网管观察计算机与交换机的连接情况,查看是否有时断时通的现象,交换机CPU负载率是否很高,线路流量是否很大。通过观察设备端口状态,分析和观察交换机哪个端口所接的计算机发包量不太正常。
2.查看网络设备日志法
通过查看网络设备的日志,分析设备状况。笔者曾通过showlonging命令,观察到4006交换机下连的2950交换机每隔7小时down掉,然后又up,因时间间隔较长,单位人员未感觉网络中断。笔者检查并确定了光缆、光收发器、网线、交换机配置、交换机端口均正常,后来的间隔时间由原来的7小时减少到7分钟,由此判定2950交换机本身有故障,马上将已准备好的备用交换机换上,从而减少了处理故障的时间,并在最短时间内恢复了网络。
3.替换法
替换法就是使用一个工作正常的物体去替换一个工作不正常的物体,从而达到定位故障、排除故障的目的。这里的物件可以是一段线缆、一个设备和一块模块。
4.配置数据分析法
查询、分析当前设备的配置数据,通过分析以上的配置数据是否正常来定位故障。若配置的数据有错误,需进行重新配置。
计算机网络技术发展迅速,网络故障也十分复杂。网络出现故障时,为了以最快速度恢复网络的正常运行,在网络维护中,还需要注意以下几个方面的问题:第一,建立完整的组网文档,以供维护时查询。例如,系统需求分析报告、网络设计总体思路和方案、网路拓扑结构的规划、网络设备和网线的选择、网络的布线、网络的IP分配,网络设备分布等。第二,做好网络维护日志的良好习惯,尤其是有一些发生概率低但危害大的故障和一些概率高的故障,对每台机器都要做完备的维护文档,以便于以后故障的排查。这也是一种经验的积累。第三,提高网络安全防范意识,提高口令的可靠性,并为主机加装最新的操作系统补丁程序和防火墙、防黑客程序等,以防止可能出现的漏洞。
(作者单位:海口市高级技工学校)
转载注明来源:http://www.ybaotk.com |
上一篇:网络安全及其对策下一篇:引入服务器群集技术 助推校园信息化
|