光传输网络网元“脱管”问题综述

(整期优先)网络出版时间:2023-09-23
/ 3

光传输网络网元“脱管”问题综述

姚琦  庞瑞军  侯健

海军士官学校   安徽省   蚌埠市  233012

摘要  光传输网络中网元的离线虽不常见,但危害极大。作为通信网络的维护人员,了解掌握网元脱管的种种原因及排除方法必不可少。本文就对网元脱管问题进行专题研究,尽可能梳理罗列出网元脱管的各种情形及原因,便于指导一线网络管理员进行学习维护。

关键词:光传输网络、网关网元、脱管、嵌入控制通路、 数据通信通路

引言 

光传输网在组建、维护过程中都需要网管的参与。利用网管对初始的光传输网络进行业务配置,对网络运行状态进行监管,对上报告警及时发现等,可以说,没有网管就相当于通信人没有了眼睛和耳朵一样。对传输网络的实时状态便失去控制。因此,对传输网络的控制管理需要,要求网管一定要在线。但在某些情况下,会导致网管丧失对网元的控制管理,呈现“脱管”状态,[1]这需要网络管理员高度重视,及时处理好脱管问题,因此,必须要对网元脱管的原理十分了解。本文就针对导致网管的原因进行梳理分析,力求让读者全面了解网元脱管的全部真相。

1、网元脱管的根本原因

要想弄明白这个问题,首先要知道网元网管管理网元的基本原理。换句话说,即:网管如何做到和网元通信从而实现对网元的管理控制的呢?从连接关系看,网管计算机通过网线和光传输网中的一台光端机(网元)进行连接,通过光端机之间的光缆线路,实现对其他网元的通信的。直接和网管计算机相连接的网元称为网关网元。这里我们可以看出,网管与网元间的通信分为两种情况:一是网管与网关网元的通信。它是通过网线来实现的,具体来说是通过计算机网络中的TCP/IP协议,实现网关网元和网管之间的通信。即通过组建网管计算机与网关网元之间的IP寻址方式,网管计算机便找到了网关网元。二是与其他网元间的通信。这里就需要用到嵌入控制通路(ECC)。其他非网关网元就是通过SDH帧结构中的D开销字节,在光纤链路建立起来之后,形成串接的数据通信通路(DCC),从而实现相互间的通信,从而使得网管计算机也能发现它们。这样一来,在光纤传输网里的网元就都能被网管发现了。了解了这一点,我们就能很好地去分析哪些原因会造成这种通信中断,中断就意味着脱管。[2][3]

2、常见网元脱管原因分析

2.2网关网元脱管

2.1.1.现象

从网管上看,网关网元和其他网元均处于离线状态,网管失去对该网关网元以及其他所有该网元所属的非网关网元的控制。从前面的分析我们可以知道,由于网关网元是网管和其他网元之间通信的桥梁,因此网关网元的离线必然导致网管失去对其他网元设备的控制,造成全部网元的脱管。

2.1.2.可能原因

一是线缆或接口故障。有可能是网线或接口问题,导致线路不通,造成脱管。如果是此问题,很容易从网管计算机的本地连接状态看出来。本地连接显示掉线,则发生网线故障的可能性极高,更换网线进行验证即可。若本地连没有掉线,那么网线出现问题的可能性极小,那就有可能是第二个问题。二是网管计算机的IP和网关网元不在一个网段内。发生这种问题的原因是有人修改过网管的IP,虽然实际中要求网管计算机专用,这种可能性极小,但也不能排除在对网管进行维护测试时的一些违规操作。若是此类情况,则将网管计算机IP地址和子网掩码修改为网元所在的网段即可。当然还有一种特例,就是网管与网关网元的IP地址冲突,这种情况也会造成通信中断,但观察本地连接(显示IP地址冲突)也易发现。当然还有一种情况,就是网元断电。这种情况也会造成脱管,后续不再分析。

2.2非网关网元脱管

2.2.1.现象

网络中某个(环网)或某些(链网)非网关网元离线,网关网元正常在线。

2.2.2.可能原因

分为两种情况讨论。

2.2.2.1多个网元离线

链网中的这种情况很常见。由于是链,每个网元与网管之间都只有一条链路,因此,某网元的脱管,都会影响到其后网元也会脱管。这主要是由于光纤连接的问题造成的,如光纤断开,是最常见的原因。由于光纤断了,ECC链路不通,网管便无法和网元通信,从而造成网元的脱管。这里只要注意通过网管告警查证光纤状态即可。对于环网而言,由于是ECC的通道有2条,因此,要发生这种情况,必须发生离线的网元两侧的光纤都断开才行。告警上也有迹可循。因此这种情况并不复杂。最麻烦的莫过于只有一个网元脱管。

2.2.2.2单独一个非网关网元离线

我们先来分析链网中的这种情况。由于是链,每个网元与网管之间都只有一条链路,因此,通过前面的的分析我们知道,如果是光纤连接发生了什么问题,势必导致该网元之后的网元也应该处于离线状态,那就不会是单独网元的离线。因此,排除光纤链路问题。光纤正常,中间某个网元又离线,就好像网管从这个网元上跳过去一样,它成了“小透明”。什么原因呢?我们想到了DCC字节的问题。在DCC字节的应用中,有这样一种用法:在组建大型光传输网络时,由于所用组网设备厂家不同,可能存在设备跨域的问题。即中间某段设备是别的厂家的设备。网管要想跨过这段“第三方设备”从而实现对自家设备的管理时。必须保证DCC字节的“纯洁”,即保证DCC字节在经过其他厂家的设备时不被处理。因此,厂家设计可以通过设置DCC字节的透传来实现这点。所以这里我们考虑可能是设置了DCC字节透传导致的该问题。该分析对于环网同样适用。我们统称为DCC字节透传问题。

但你看到的就是事实的真相吗?还有一种问题,会导致出现这种现象。为此,我们不妨来做个实验。我们把链或环中的某一中间网元删除,那么和这个网元直接连接的光纤也删除了。由于只是在网管测的操作,并不会影响在网业务。也不影响别的网元的在线状态。此时我们再任意创建一个网元,网元ID自定义,网关选择该网中真实网关网元,由于该网元客观上是不存在的,因此,创建后必然处于离线状态。我们将刚才断开的链或环两端的设备和该离线网元连接在一起,也不会影响其他网元的在线状态。此时是不是豁然开朗?这不就是个网元离线,其他网元在线的情况吗?由此我们可以知道:我们看到的这个离线的网元已经不是以前的那个网元了,即网管上看到的和真实存在的网元不一样了。难怪会脱管。你所看到的是“假网元”。那么真网元又在哪里?如何找到它呢?设备搜索即可,注意创建网元的时候一定不能使在运行的业务中断,网元配置时,要采取上载的方式。

再来看环网的情况。环网上每一个网元的DCC通道都有2条。因此环网上出现网元脱管就更加的不容易了。DCC字节的透传当然也会出现这种脱管的现象。

除此之外,在线路维护过程中还有一个操作容易引起网元的脱管。那就是对网元的光口进行软件环回操作。在链网中,如果对一个网元在靠近网管侧的一端进行了光口的外环回,则会导致该网元的脱管,而环网中由于ECC有两条路径,便不会发生这种情况。但如果环网中对同一网元两侧都做了外环回,则该网元也会脱管。因此在做环回时应该谨慎。还有一种就是将网元的DCC字节禁用,也会带来网元的脱管。其对链网、环网的脱管影响类似于做外环回。

3、排除方法

3.1观察分析,判断脱管原因

3.1.1.观察脱管情况进行分析判断

单机脱管先看电,电在情况看连线,连线正常看嵌入(ECC),最后可能是过路(DCC字节透传)。首先确定脱管是不是因为断电引起的。例如在链网上的最后一个网元离线,则就有可能是这种情况。如果不是因为断电引起的,则可能是因为光纤链路不通引起的,于是要看一下连线的情况。这里的连线主要是指光纤,光纤不通ECC链路便不通,也会引起脱管。光纤不正常的话,首先考虑光纤断开,这时只要观察告警就可以了。如无告警,则进一步查看ECC链路判断是否为“假网元”,最后再考虑是否设置了DCC字节透传。一般而言,DCC字节透传有着明显的地域特征,如不是在第三方设备处,一般不会这么设置。因此,经过这么几步之后,基本上可以排除出具体的脱管原因了。

3.1.2.查看告警情况辅助分析判断

像上面提到的一样,可以通过查看告警信息获取线路的一些通断状况,从而辅助判断是否由于光缆线路造成了脱管。

3.1.3.搜索设备光纤辅助判断

搜索设备或者光纤,也可以及时帮助发现存在的假网元及假光纤。搜索出新的设备,可能意味着当前网管存在“假网元”,搜索光纤报错,可能意味着当前光纤连接有误。例如鸳鸯纤。

3.2处置方式

3.2.1.“假网元”的处置办法

在能够登录的网元处查看ECC链路路由,可以发现与其有实际连接关系的网元名称和ID,如果脱管网元为“假网元”的话,此时在ECC链路路由中一定会发现一个不知名的网元名称和ID,这也是一种提醒。将之前的假网元删除,将此真网元创建,采取上载方式进行数据上传,网管上便会恢复对该网元的管理控制,问题也就解决了。

3.2.2.DCC字节透传

设置了DCC字节透传,该网元脱管,且在DCC链路中也就不能发现它了。这个时候只能远程指挥或者赶到现场去,用网线将该网元与网管直接进行连接,登录该网元进行查看修改即可。

3.2.3.DCC字节禁用

必须将网管直接用网线与网元连接,登录网元后将字节使能才可。

3.2.4.光口软件外环回

一般光口的换回操作系统默认都是一段时间后便会自行恢复,因此,可以等待恢复后,网元就会自动登录。当然,也可以像处理DCC字节禁用的方式一样,采用网线直连的方式进行设置更改。这里顺便提一下,若是需要直连网线的方式来进行更改设置,也可以远程进行操作。可以利用光缆线路以及架挂光传输设备的以太网板,进行业务配置后,通过以太网板网口引接的方式,将远程网管计算机与脱管网元的网管口接在一起,从而实现远程管控修改的目的。

3.2.5.断电、断线等原因

这种处置的方式就比较容易发现了,进行加电操作或者线缆维修更换即可。

结束语

网元脱管的根本原因是其ECC失效,因此,一切造成ECC失效的可能性都会带来网元的离线。分析时要考虑全面。要根据脱管的具体情况进行分析判断,切勿天马行空胡猜乱想,应该遵循一定的顺序进行逐一排查,这样才能准确及时地找到问题。

参考文献

[1]SDH传输网元脱管浅析。韩加林,铁路通信信号,2010。

[2]SDH传输系统网元脱管分析及处理。孙青,上海铁道科技,2012。

[3]SDH网元脱管故障处理基本方法。高峥,现代电信科技,2020。

姚琦,男,汉族,1982年6月生,安徽颍上,硕士研究生,海军士官学校讲师,

研究方向为光纤通信与光传输技术。