交换机升级排障实例

各公司的网络管理员在选购网络设备的时候都是精挑细选,在同等级别的不同厂商之间反复研究,多次比较后选出最佳性价比的产品来。不过有一点可能很多网络管理员都忽略了,那就是网络产品的未来,一个产品不可能一直使用肯定会有出问题的时候,出问题后厂家的服务就显得尤为重要了。同样网络技术是在不断发展前进的,网络产品也要有一定的可升级可扩展性。最近笔者就遇到升级核心设备的问题,现记录如下:
  一,升级环境:
  
  事情的原因是这样的,公司下属部门申请到一定的经费用于网络升级,因此该部门前几天新买了一台思科的Catalyst6509交换机,并且配备了WS-X6548-GE-TX这个思科在去年四月才新推出的10M、100M、1000M自适应的48口RJ-45交换模块。6509一共有9个插槽,所以可以插上9个模块,为核心设备升级添加模块是习以为常的事情了。不过由于思科的软件推出总是滞后于硬件,所以拿到手的Catalyst6509交换机标准配置的12.2(14)SX1版本的IOS并不能支持该模块。这就涉及到了升级问题,需要升级6509交换机的IOS。于是我和子部门网络管理员从CISCO官方网站找来支持WS-X6548-GE-TX模块的新版本的IOS准备升级。没有想到,这次简单的升级工作缺弄得我们两个“准高手”麻烦连连,问题接二连三地出现。
  
  二,没有RJ-45接口
  
  对于本次采用的这个WS-X6548-GE-TX模块一共有48个RJ-45端口,然而6509交换机又没有配其他的带RJ-45接口的模块。这可怎么办呢?毕竟用思科的TFTP Server升级IOS就必须得将交换机和网络上的一台装有TFTP Server的PC相连。经过一番寻找,终于发现超级引擎720上面有一个RJ-45模样的接口,旁边写着Link的字样,结果拿来网线插上一试,发现指示灯都不亮。本来我们两个以为有了希望,然而指示灯不亮就说明该接口无法使用,不过因为这个接口是惟一的希望,否则只能用xmodem方式传输41MB的IOS,传输时间恐怕让我望而却步。
  
  小提示:
  
  使用XMODEM传输IOS速度上是非常让人头疼的,笔者曾经用XMODEM方式传过一个2950交换机的IOS,总容量也就2MB左右,足足用了两个钟头。按照这个速度来说41MB最快也得30几个小时。
  
  既然使用XMODEM方式传输IOS不太现实,那么还要从超级引擎720上面那个RJ-45模样的接口入手。从网上搜索到相关资料,原来超级引擎720上的port2 有两种模式:一种是RJ-45接口,还有一种是SFP(a small form-factor pluggable)接口。而默认的设置是SFP,要使用RJ-45接口就必须更改设置。输入以下命令进行修改——
  Router(config)#interface gigabitethemet 5/2
  
  //进入该接口进行设置
  Router(config-if)#media-type rj45
  
  //修改模式为RJ45,默认是SFP
  Router(config-if)#no shutdown
  
  //启用该接口
  
  执行命令后发现橘红色的指示灯终于变成了绿色,接下来就可以使用传统的TFTP方法将升级所需的IOS文件传到到交换机中。本来以为接下来的事情就应该很轻松,谁知道拦路虎并没有就此罢休。
  
  三,TFTP传输协议不支持32兆
  
  接下来给接口配上管理地址,再把原来的IOS备份出来。在超级终端全局模式下输入命令:
  Router#copy sup-rootflash: s72033-pk9sv-mz.122-14.SX1.bin tftp://192.168.1.1
  
  TFTP Server 出现一连串#字号,开始传输数据,本来以为一切OK。谁知道眼看着就要传完的时候,系统提示:“timeout! Write error!”。
  
  根据系统提示的信息我查询了网线是否断了,磁盘空间是否不足,答案都是否定的。再次执行传输命令故障依旧。到6509上查看传输完毕的IOS大小为32MB,比完整的IOS32.1MB稍微小一点。为什么多出的0.1MB就无法传送呢?
  
  开始以为是TFTP的软件有问题,版本过低造成的。从网上下载了一个第三方的TFTP server一试,结果还是这样。又找来3Com的TFTP Server,这次效果更差,传到16MB的时候就断开了,系统提示还是超时和写入错误。仔细分析,终于发现了问题关键所在。两次传输,一次正好32MB,一次正好16MB,连字节数都不差,肯定不是传输线路问题。找来资料一查,原来TFTP(Trivial File Transfer Protocol)普通文件传输协议最大就支持传输32MB的文件。于是又找来思科文档,一番查询,找出了第2种解决方法,用FTP就行了。于是在PC上建好FTP服务,键入如下命令:

  Router# configure terminal
  
  //进入交换机配置模式

  Router(config)# ip ftp username username
  
  //设置FTP的访问用户名

  Router(config)# ip ftp password password
  
  //设置登录FTP的密码

  Touter(config)# end
  
  //结束,退出

  Router#copy sup-bootflash:  s72033-pk9sv-mz.122-14.SX1.bin ftp:[//[username[:password]@]192.168.1.1]
  
  //执行FTP传输命令,传输文件为s72033-pk9sv-mz.122-14.SX1.bin,已经建立好的FTP服务器地址为192.168.1.1。
  
  使用FTP传输更新IOS后文件复制非常正常,等待了几分钟,系统提示“successful!”。看来FTP比TFTP就是强大灵活,限制也少很多。

四,协议错误
  
  将IOS成功备份到FTP上后就轮到将新的用于升级的IOS进行上传了。进入6509配置模式使用如下命令进行操作:
  
  Router# configure terminal
  
  //进入配置模式

  Router(config)#ip ftp username username
  
  //设置登录FTP的用户

[1] [2] 下一页  

文章录入:csh    责任编辑:csh 
  Router(config)#ip ftp password password
  
  //设置登录FTP的密码

  Router(config)#end
  
  //退出设置

  Router# copy ftp:[[//[username[:password]@192.168.1.1] / s72033-jk9o3sv-mz.122-17a.SX.bin] sup-bootflash:
  
  //复制s72033-jk9o3sv-mz.122-17a.SX.bin新版IOS到本交换机。
  
  本来以为轻轻松松完成的,结果系统这次提示“Protocol error!”。协议错误?重试一次,下载没有问题的,上传还是提示协议错误。经过笔者分析怀疑问题可能出在FTP Server上,我的FTP Server是用Server-U这个第三方软件做的,会不会是兼容性问题造成的呢?于是换成微软Windows2000自带IIS中的FTP组件建立FTP服务器。再次尝试下载与上传都没有任何问题了,不再提示协议错误。屏幕显示Loading…。几秒钟后又出现提示信息:“Flash空间不足”。
  
  五,Flash空间不足
  
  出现FLASH空间不足信息后我特别查询了6509核心设备的硬件配置,默认6509标准配置的Flash为64MB,标配IOS大小为32.1MB,要升级的12.2(17a)SX 版本IOS大小为40.6MB,这样看来空间不足再所难免。但是这个问题还是相对好解决的,将Flash里原来的IOS删除了然后再上传。于是输入命令:
  
  Router#delete sup-bootflash:s72033-pk9sv-mz.122-14.SX1.bin
  
  然后再传。提示信息还是空间不足!这个时候交换机的IOS已经被我删除了,要是不小心掉电或者重起的话,交换机就起不来了。在管理界面中用show命令看,IOS文件已经没有了,但是空间还是剩余30多兆,就是说flash没有被清空。这时候想起以前删除vlan.dat文件后要重启交换机才能生效,可是现在重启是万万不行的。怎么办?上思科网站查找有利用价值的信息,终于找到一条命令squeeze,该命令是将已经删除的文件彻底清空,就好比清空回收站一样。运行:
  
  Router#squeeze sup-bootflash:后再用SHOW命令查看,发现Flash已经被彻底清空,可用空间为64MB。这时候再用FTP上传,几分钟以后就会看见屏幕上提示的成功信息。Reload一下,用show flash命令看IOS版本已经变成了12 .2(17a)SX。插上新模块WS-X6548-GE-TX一试,一切OK,新模块可以正常运行了。
  
  经验总结:
  
  本来以为轻松完成的工作却是一波三折,看来高端产品升级也是非常复杂的,很多原来没有重视的环节都会出现这样或那样的问题。本次故障排除使我也明白了一个道理,技术没有尽头,遇到问题到官方网站查询是最好的办法。还有就是做事情之前一定要三思,如果删除FLASH后想当然的执行了RELOAD的话,交换机就无法启动了,那样的后果将会非常严重。操作前请停手思考30秒往往可以减少很多不必要的损失

上一页  [1] [2] 

文章录入:csh    责任编辑:csh

(0)

相关推荐

  • 交换机升级排障实例

    各公司的网络管理员在选购网络设备的时候都是精挑细选,在同等级别的不同厂商之间反复研究,多次比较后选出最佳性价比的产品来.不过有一点可能很多网络管理员都忽略了,那就是网络产品的未来,一个产品不可能一直使用肯定会有出问题的时候,出问题后厂家的服务就显得尤为重要了.同样网络技术是在不断发展前进的,网络产品也要有一定的可升级可扩展性.最近笔者就遇到升级核心设备的问题,现记录如下: 一,升级环境: 事情的原因是这样的,公司下属部门申请到一定的经费用于网络升级,因此该部门前几天新买了一台思科的Catalys

  • 交换机故障的一般分类和排障步骤

    交换机的优越性能和价格的大幅度下降,促使了交换机的迅速普及.网络管理员在工作中经常会遇到各种各样的交换机故障,如何迅速.准确地查出故障并排除故障呢?本文就常见的故障类型和排障步骤做一个简单的介绍.由于交换机在公司网络中应用范围非常广泛,从低端到中端,从中端到高端,几乎涉及每个级别的产品,所以交换机发生故障的机率比路由器,硬件防火墙等要高很多,这也是为什么我们首先讨论交换机故障的分类与排除故障步骤的原因. 一,交换机故障分类: 交换机故障一般可以分为硬件故障和软件故障两大类.硬件故障主要指交换机电

  • linux php-cgi.exe占用cpu 100%的一次排障之旅

    先说下我们网站的架构,由于目前网站访问量不是很大,但是由于最近公司网站要推广,所以将网站由单机切换成前端用nginx做负载均衡,带动两台web服务器,所有网页和静态文件都通过NFS共享调用,NFS服务装在其中的一个web服务器上,后端用mysql主从的方式,是很典型的架构. 切换成这个架构才2天,就收到nagios的报警,报警信息显示有一台web服务器负载很高,于是通过SecureCRT登录到服务器上,用top命令看了一下,发现有几个php-cgi进程占用了大量的CPU,如下: 13889 ww

  • win2003服务器.NET+IIS环境常见问题排障总结

    你是否经常会遇到以下的拦路虎,当你兴致勃勃地把调试好的程序发布到WEB服务器时,以下错误就出现了: 1.无法找到文件(404)白底黑字 2.没有权限访问该文件(403)白底黑字 3.直接弹出来一个要输入帐号密码的框框,然后你对着屏幕说:什么密码. 4.黄底黑字+红字的错误提示页(.Net) 5... 这些东东几乎占据了.Net+IIS搭建环境的绝大部分错误. 有时我们无意中覆盖一个"不起眼"的文件,上述错误就会蹦出来.碰巧该应用又是非常重要的应用,这足够让你接下来的一个小时冒冷汗. 不

  • Linux 全能系统监控工具dstat的实例详解

    全能系统监控工具dstat dstat 是一个可以取代vmstat,iostat,netstat和ifstat这些命令的多功能产品.dstat克服了这些命令的局限并增加了一些另外的功能,增加了监控项,也变得更灵活了.dstat可以很方便监控系统运行状况并用于基准测试和排除故障. dstat可以让你实时地看到所有系统资源,例如,你能够通过统计IDE控制器当前状态来比较磁盘利用率,或者直接通过网络带宽数值来比较磁盘的吞吐率(在相同的时间间隔内). dstat将以列表的形式为你提供选项信息并清晰地告诉

  • 配置路由器实现多设备控制端口访问

    只需要一台CISCO路由器加上异步模块或是一台具有内建异步串口的路由器,你就可以在一个工作间或数据中心里面全面享受对一系列网络设备的控制连接了.现在让我们来看看这些工作是如何进行的,同时学习如何管理多个连接,并且看看一些你应当考虑的安全问题. 这样的情形是否让你感到很熟悉呢?你在家里利用防火墙.路由器和交换机进行工作,但是无法去碰那些设备.最后你却不得不开车到办公室更新配置或者重新启动设备. 这样如何?网络崩溃了,你需要快速方便的访问所有网络设备的控制端口.你会发现你拿着笔记本电脑在机架设备之间

  • Redis偶发连接失败案例实战记录

    前言 本文主要给大家介绍了关于Redis偶发连接失败的相关内容,分享出来供大家参考学习,下面话不多说了,来一起看看详细的介绍吧 [作者] 张延俊:携程技术保障中心资深DBA,对数据库架构和疑难问题分析排查有浓厚的兴趣. 寿向晨:携程技术保障中心高级DBA,主要负责携程Redis及DB的运维工作,在自动化运维,流程化及监控排障等方面有较多的实践经验,喜欢深入分析问题,提高团队运维效率. [问题描述]  生产环境有一个Redis会偶尔发生连接失败的报错,报错的时间点.客户端IP并没有特别明显的规律,

  • 电脑"蓝屏"原因之速查手册

    死机是令操作者颇为烦恼的事情.死机时的表现多为"蓝屏",无法启动系统,画面"定格"无反应,鼠标.键盘无法输入,软件运行非正常中断等.尽管造成死机的原因很多,但是万变不离其宗,其原因永远也脱离不了硬件与软件两方面.  一.由硬件原因引起的死机  [散热不良]    显示器.电源和CPU在工作中发热量非常大,因此保持良好的通风状况非常重要,如果显示器过热将会导致色彩.图象失真甚至缩短显示器寿命.工作时间太长 也会导致电源或显示器散热不畅而造成电脑死机.CPU的散热是关系

  • 运维的85条规则

    1.容量第一,优化第二--这条规则在故障发生时生效.在宕机的时候别研究什么优化,先恢复设备. 2.保留所有可以捕获的记录--以 PostgresQL 为例,包括有 WAL 文件,Slony 复制,快照技术,基于硬盘的 DB 版本(快照附带的) 3.不要因为优化引入更多问题.通常我们解决问题时做出来的东西都会转变成之后运维工作的负担.请确认为运维工作开发的那些工具已经完全交付使用.这些东西经常无法正常运行结果要返回开发组重来.更重要的,这种变更请求通常会打破团队原本安排好的工作计划. 4.保持简单

  • 网管工具nstat网络状态一目了然

    经常使用Windows 2000 / XP的朋友们一定都注意过系统任务栏的右下角处有一个经常闪动的小电脑图标,默认情况下,它的主要任务就是指示本机与网络是否有数据传输,同时也显示一些类似于IP地址这样的简单网络参数,虽说这对于我们这些普通用户来讲,它所提供的这些信息已经足可以供我们使用了,但对于平时经常对网络进行排障的专业工程师来说,可就显得有些力不从心了,有时为了完成必要的工作,网络工程师们不得不一遍遍在故障机器上安装各种各样第三方软件,不仅浪费时间和精力,也使得Windows的这项免费功能成

随机推荐