ASON网络的运维和管理

ASON技术在传统的传输网络中引入了控制层面,实现了节点、连接的自动发现,实现了连接的自动建立,实现了多点故障的保护恢复和多种保护恢复机制的选择。 这种智能性给传统网络的运维带来了不小的变化,传统传输网络管理和运维的很多工作都需要人工参与,而ASON网络中大多数工作是自动完成的,这种变化不仅仅是简单的人工到自动,而是理念上的变化。< BR>  
  传统传输网络的运维和管理

  网络的运维和管理主要包括以下工作:电路调度、告警分析、故障管理、性能分析、资源管理、数据处理、网络优化等。在以分层方式实现运维和管理的传输网络中,这些工作大多都是靠工作人员来完成的。

  网管人员进行电路调度时,在知道所需的电路的源和目的地址以及所需带宽的情况下,需要查看网络的可达路由中哪些是空闲的,然后依据流量均衡、最少跳数,最小代价或者其它约束条件从这些空闲的路由中选择一条路由进行配置。具体配置过程中,还要依据所需带宽,选择合适的时隙沿路由对经过的节点进行交叉连接配置。如果在一个环中无法配置所需电路时,则需要跨环进行配置,这样路由的选择和交叉连接的配置就更为复杂,需要的时间也更长。如从北京到上海需要配置一条2M的电路,查找到的路由为北京-武汉-上海,而该电路需要在两纤双向复用段保护环中(速率为10G)配置,为了说明配置过程,我们以武汉节点为例来说明,为配置该电路,必须指定2M的入时隙和出时隙,而确定入/出的2M时隙必须了解该2M在所属155M中的位置(155M中包括63个2M),还必须指定该155M在10G中的位置(10G包括64个155M),这样,指定了2M在入/出节点中第几个155M的第几时隙就可以进行交叉连接配置。由此可见,当电路经过的节点数比较多时,配置是非常复杂和耗时的,而且也不利于统一规划和网络的优化。

  告警分析和故障的管理,在传统的传输网络的告警分析中,主要依赖厂家网管系统中提供的简单的告警处理,而故障的定位和管理根本就没有。这在纯SDH系统中,问题还不是太大,但在SDH+WDM系统中,由于底层故障不仅反映到自身系统中,还反映到上层多个相关联的系统中,没有故障定位就会导致多层保护倒换无法协调,而且给故障的人工处理也带来一定的难度。总之,告警分析简单、缺乏故障处理能力给网络管理和运维带来的问题比较大,因为故障情况下,受影响的业务都需要得到实时或者准实时的解决,这就需要故障的快速定位和处理。这也是大多数运营商非常关注故障定位的原因。

  网络优化和资源管理:网络的优化一般是在两种情况下进行的,一是资源分配不合理或者不够用;二是提高网络的其它指针(如运维考核指针、网络安全性指针等)。传统的传输网络为环形网络,所以如果在一个环中配置路由时,可选择的路由只有两条,一般情况下,选择的路由都是跳数最少的路由,这样可以节约板卡资源。而由于业务发展的不均衡性,这样选路的结果就会导致环网中局部资源利用率过高,而其它部分利用率过低的现象,这种现象在节点数较多的环形网络中更为常见,所以为了优化网络使用的资源,需要调整电路,使资源得以合理利用。可想而知,这在业务已经配置好,而且调度需要完全手动的情况下是多么复杂,而且在线业务的手动重新配置的风险也比较大,由此导致的结果就是仅仅进行局部的优化,而是不断的升级扩容或者大环拆小环的工作。此外,运行维护的指针有时候和资源优化的目标是相互矛盾的,安全性指针是网络中最重要的指针,而为了保证某些重要电路的安全性,使其具有抗双点故障的性能,或者避免出现双点故障情况下出现某些局向全阻的现象,某两点之间的电路(某个局向的电路)就应该分配到不相关的,而且不在同一个环上的两条或者多条路由上,因为不在同一个环上的两条路由,必定有一条不是最优的,而且有可能代价很大,这样势必造成网络资源的浪费,所以这种调整往往是在出现故障已经影响到重要的业务,或者是在预测到单个环上故障概率很高的时候的一种预防措施,譬如说飓风、洪水等自然灾害的影响。

  性能分析和数据处理:这是日常维护和管理工作不可缺少的一部分,从大量的表格中取出有用的资料来进行分析和处理,然后分析出电路利用率、信道组织图,故障概率表,资源利用率等,按星期、按月和按季都要出这样的分析报表,此外,为了分析的方便,还经常需要当年和往年同期比较的资料分析,在传统的运维中,这部分工作都需要人工来做,工作量大,而且容易出错。
  
  ASON网络的运维和管理

  相比传统传输网络的运维和管理大部分靠人工完成,ASON网络的运维和管理则主要是自动完成的。

  ASON网络中的电路调度是非常容易的,只需知道源和目的地址、带宽需求、保护倒换等级,并指定选路的具体目标(如代价最小、跳数最少),控制平面就会按照要求自动选择一条满足条件的最优路由。某些特殊的情况下需要指定是否必须经过哪些节点/链路或者必须不经过哪些节点/链路,是否需要业务均衡,还有是否要求SRLG(共享风险链路组)不相关等一些约束条件。  

  ASON网络中对告警做了专门的处理和分析,可以实现故障的自动定位,这种定位包括两个层次,一是硬件故障,二是线路故障。正因为有了故障的立即寻址功能,ASON网络才可以支持线路保护和业务保护共存,支持多粒度、多层次的网络保护。目前,基于SDH的ASON的故障定位功能已经初步实现,基于OTN的ASON的故障定位功能比较复杂,因为其定位涉及到纯光层告警的处理和分析。

  ASON具有丰富的性能分析和强大的数据处理功能。可以很方便地给出资源利用率的统计和分析、信道组织图统计,还可以给出网络故障分析,即分析网络中单点故障情况下,网络的受损情况,逐个点遍历,以此得出哪个点的重要性最高;同样可以对任意两点进行遍历,进而提供单点故障情况下,应该重点保护哪些区段。同理,也可以对多区段故障进行分析。此外,可以提供链路资源利用率的比较、业务路径显示,还可以选择对某链路或者某个节点的资源占用情况单独分析和处理,并且给出升级扩容的建议。

  网络优化规划工具是ASON相比传统传输网络所独有的一个部分,也是相对独立的一个部分。网络优化规划的功能很多,可以用作初期的网络规划,对提出的网络方案做技术经济的可行性分析,并对影响因素做灵敏度分析,得出对CAPEX和OPEX影响最大的因素,对其做特殊重点的考虑。可以用作资源的优化,对使用不合理的资源进行重路由,以使得全网的资源利用趋于合理,还可以进行碎片整理,节约网络资源。优化规划工作一般是离线进行的,但是它有和现网的接口,可以在线把现网上的数据采集过来进行分析和处理,利用这些资料来对现网进行优化分析,并把优化后的数据逐条下载到网管上,动态实现对网络优化的管理。优化规划的目标很多,包括提高网络生存性、提高资源利用率、降低投资、提高投资收益比等,具体优化可以按照单目标进行,也可以按照多目标的方式进行,常用的应该是多目标优化,即把最重要的目标作为优化目标,其它目标作为约束条件来进行综合的优化和规划。

  此外,业务管理也是ASON独有的一个部分,因为ASON网络中可以引入一些新的业务,如OVPN、BoD、组播和带SLA的服务,这就需要对这些业务进行管理和维护,这不仅需要安全性的设置,还需要依据需求随时给客户调整服务等级和带宽,这些调整是在线进行的,不会对业务造成损伤。
  
  运维变化带来的好处和问题

  不难比较,传统网络的运维和管理需要大量工作人员的参与,从路由的选择到交叉连接的配置,从故障的定位到各种数据的处理,每一个环节都离不开网管和运维人员的直接参与,这无疑浪费了大量的人力,而且选路和优化规划时可能无法达到统一或者完善。但从另一方面讲,也培养了大批非常了解网络“状态”的工作人员,在出现网络故障的情况下,只要网络中有剩余资源,网管人员就可以进行故障的恢复。而ASON网络的智能性大大简化了运维和管理工作,几乎所有实际操作都由软件来完成,运维网管人员需要做的不再是实际去操作,而是熟悉和掌握网管软件的使用,特别是网管软件中各种属性参数如何设置,如SRLG、保护属性、代价等,并且要了解这些属性参数在实际算法中到底起到什么样的作用。由于无需去人工配置和计算,运维网管人员可以很轻松的进行日常维护工作,但因其了解到的仅仅是一些属性参数和一些基本的操作,如果对ASON运行原理没有较深的了解的话,就可能对智能过度依赖,而时间长了就会造成对网络不熟悉,这样在出现软件故障或者其它不可预测的重大故障导致智能保护失效的时候,就有可能无法及时采取有效措施对网络进行人工操作来进行网络的恢复。

  从辩证的观点来看,正是因为传统的传输网络不具备智能性,使得网络运维和管理都需要工作人员参与,所以培养了一大批“智能”的运维和网管人员。而ASON网络的智能性容易造成运维和管理人员对智能的依赖。所以,ASON的自动化在减轻工作量的基础上给运维和管理人员也提出了新的要求,要求他们不仅仅了解如何操作ASON的网管系统,能够熟练地设置相关参数,更为重要的是了解有关路由、保护恢复等参数设置的原理,还要定时地对网络的各种资料进行统计、处理和分析,以清晰了解网络的状态;同时对ASON设备在软硬件平台的可靠性、智能的可管理性、运维和管理的功能完善性、易操作易管理性等方面提出了更高的要求,特别是对控制平面故障情况下的运维和管理提出了特殊的要求,不仅要求控制平面的故障不能影响到正常业务,还要求控制平面有一定的自愈性。

  ASON的优化规划功能的使用是网管和运维人员必须认真掌握的工具,网络运行的状态以及资料的处理和分析大多都需要该优化规划工具来执行。目前,ASON优化规划工具是区分不同设备厂商产品成熟度的重要依据,也是需要在运维中不断改进和完善的重点内容。优化规划工具的成熟与否直接影响到ASON网络运维管理的好坏。
  
  总结

  ASON给网络的运维带来了革命性的变化,相比传统传输网络,它的智能性可以节约大量人力。之所以提出辩证的观点来看ASON运维和管理,不是否认ASON带来了运维和管理上的便利,而是肯定ASON带来了网络管理和运维上革命性的功绩。只要运维和网管人员能充分掌握其工作原理,一定能在这场革命中受益匪浅。 文章录入:csh    责任编辑:csh

(0)

相关推荐

  • ASON网络的运维和管理

    ASON技术在传统的传输网络中引入了控制层面,实现了节点.连接的自动发现,实现了连接的自动建立,实现了多点故障的保护恢复和多种保护恢复机制的选择. 这种智能性给传统网络的运维带来了不小的变化,传统传输网络管理和运维的很多工作都需要人工参与,而ASON网络中大多数工作是自动完成的,这种变化不仅仅是简单的人工到自动,而是理念上的变化.< BR> 传统传输网络的运维和管理 网络的运维和管理主要包括以下工作:电路调度.告警分析.故障管理.性能分析.资源管理.数据处理.网络优化等.在以分层方式实现运维和

  • Python自动化运维和部署项目工具Fabric使用实例

    Fabric 是使用 Python 开发的一个自动化运维和部署项目的一个好工具,可以通过 SSH 的方式与远程服务器进行自动化交互,例如将本地文件传到服务器,在服务器上执行shell 命令. 下面给出一个自动化部署 Django 项目的例子 # -*- coding: utf-8 -*- # 文件名要保存为 fabfile.py from __future__ import unicode_literals from fabric.api import * # 登录用户和主机名: env.use

  • 运维管理器Fabric使用方法

    Fabric的安装 Fabric支持pip,easy_install或源码方式安装,很方便解决包依赖问题,(根据用户环境,自行选择pip或ease_install) pip install fabric easy_install fabric 源码安装不介绍了. 校验安装结果,如果导入模块没有提示异常,则说明安装成功: root@Python_S6:~# python Python 2.7.5+ (default, Sep 19 2013, 13:48:49) [GCC 4.8.1] on li

  • Linux运维之如何使用ss命令代替netstat

    前言 在运维和管理 Linux 服务器的时候,我们最常用的一个命令就是 netstat,我常用这个命令来查看当前服务器上有哪些进程正在侦听端口,主要用来诊断网络服务的工作状态. 不过,最近有一次安装好一个 Ubuntu 发型版,发现默认没有安装 netstat,觉得非常奇怪,自己手动安装后,发现 man pages 提示,netstat 命令已经是 deprecated 了,建议使用 ss 命令代替. This program is mostly obsolete. Replacement fo

  • MySQL 角色(role)功能介绍

    前言: 上篇文章,我们介绍了 MySQL 权限管理相关知识.当数据库实例中存在大量的库或用户时,权限管理将会变得越来越繁琐,可能要频繁进行权限变更.MySQL 8.0 新增了 role 功能,使得权限管理更加方便,本篇文章我们来看下 8.0 下的 role 功能. 1. role 简介 role 角色功能对于 Oracle 数据库来说不算是什么特殊,在 Oracle 中经常被用到.MySQL 8.0 版本终于新增了 role 功能,为数据库用户权限管理提供了一种新思路. role 可以看做一个权

  • 运维的85条规则

    1.容量第一,优化第二--这条规则在故障发生时生效.在宕机的时候别研究什么优化,先恢复设备. 2.保留所有可以捕获的记录--以 PostgresQL 为例,包括有 WAL 文件,Slony 复制,快照技术,基于硬盘的 DB 版本(快照附带的) 3.不要因为优化引入更多问题.通常我们解决问题时做出来的东西都会转变成之后运维工作的负担.请确认为运维工作开发的那些工具已经完全交付使用.这些东西经常无法正常运行结果要返回开发组重来.更重要的,这种变更请求通常会打破团队原本安排好的工作计划. 4.保持简单

  • 路由技术ASON标准化的关键点

    自动交换光网络(ASON)是传送网发展的趋势,而路由技术是整个ASON的核心技术之一,也是ASON标准化工作的重点和难点. 目前,国际上的标准化组织如ITU-T.IETF和OIF都在对ASON路由技术进行研究和标准化,而每个组织的工作方式和思路却不尽相同. OIF DDRP问题分析 DDRP为域 间路由协议,目前OIF将DDRP改称为"运营商内基于OSPF的E-NNI路由".为了满足网络的可扩展性要求,OIF要求E-NNI路由协议支持分级路由方式,并至少支持4个等级.在每个路由等级应

  • 自动驾驶网络到底是什么

    1 .从宏观上理解自动驾驶网络 自动驾驶网络名字是从自动驾驶汽车的概念借用来的,这是业界的习惯叫法.虽然中文叫自动驾驶网络,但对应的英文却是Autonomous Driving Network,也有部分人使用Self-driving Network,而TMF用了Autonomous Network名字.Autonomous这个词是自治的意思,强调网络的自主决策能力.不过自治这个词仔细琢磨其实有点不合适,因为网络为人服务的,一定要按人的想法执行,哪来的自治?在自动驾驶汽车怎么称呼上,也有类似争议,

  • 不错的一篇网络管理员入门与基础技术文章第1/2页

    学习基础知识当好称职网络管理员    本着就近原则,毕业后本人在一个国企当上了一名网络管理员.企业不大,机器也就500~600台左右吧:面积不大,也就700~800平方左右吧:楼房不多,也就6~7幢吧.网管本来就是一个不错的职业.想想啊,只要开始把网络设计好.做好.考虑周到点,那后来您不就一个每天喝着茶.看看报,到月初就拿工资的主儿吗?但是,实际上我们并不是你们想象中的那么清闲啊--我们还是先来谈谈网管所需要具备的知识吧.   作为网络管理员,首先必须要知道网络到底是什么?其实网络就是一个系统,

  • 详解OpenStack云平台的网络模式及其工作机制

    网络,是OpenStack的部署中最容易出问题的,也是其结构中难以理清的部分.经常收到关于OneStack部署网络方面问题和OpenStack网络结构问题的邮件.下面根据自己的理解,谈一谈OpenStack的虚拟网络.网络拓扑和网络流.个人理解有限,仅抛砖引玉,有问题请指正,谢谢. 一.相关概念和要点(可跳过) 1.OpenStack中nova-network的作用 OpenStack平台中有两种类型的物理节点,控制节点和计算节点.控制节点包括网络控制.调度管理.api服务.存储卷管理.数据库管

随机推荐