SDH传输网故障分析及处理流程

2022-09-26

传输系统的日常维护工作经常要求我们对各类故障进行定位并及时排除。故障定位最关键的是将故障点准确地定位到单板, 然后排除故障。这就需要对故障产生的原因、处理的思路及方法有一个清晰的认识, 这样才能够达到事半功倍的效果。在SDH设备的实际维护过程中, 故障告警不是一个一个孤立地出现的, 某一设备的故障往往引发相关设备的连锁告警反应, 因此, 在分析故障告警时, 不要仅对某一个告警进行孤立的分析, 要从网络系统的角度去分析告警现象, 以便正确定位故障点。

1 传输故障定位的基本原则及处理思路

众所周知, 传输故障定位一般应遵循“先抢通后修复、先外部后传输、先单站后单板、先线路后支路、先高级后低级”的原则。

S D H设备的故障很多, 在发现故障后, 在遇到故障时, 系统维护者应该不慌不乱, 仔细查看故障现象并分析可能原因, 从而做到有的放矢, 迅速处理。故障处理一般应遵循“先看, 再问, 然后思考, 最后动手”的思路。“看”是指观察系统告警灯的情况, 判断是光口故障还是电口故障, 初步分析可能的区段:“问”指查看完现象后, 系统维护者应询问各阶段现场人员, 该现象是由何种原因造成, 比如是否有人修改了数据, 删除了文件, 更换了电路板;是否遭遇停电或雷击, 是否存在操作不当现象。根据以上结果, 系统维护者再结合自己的知识思考、分析, 判断何种原因可能引起该种故障等, 做出较为正确的判断。最后根据故障定位原则找出故障点, 通过修改数据、更换单板等方法排除故障。

2 常见传输故障处理方法

2.1 环回测试法

常见的传输故障处理方法包括观察分析法、环回测试法、插拔法、替换法、配置数据分析法、更改配置法、仪表测试法。其中经常要用到的就是环回测试法和仪表测试法。

有时观察分析法不能解决问题, 如组网、业务以及故障信息相当复杂的情况和无明显告警和性能信息上报的特殊故障情况。系统维护者可以利用网管提供的维护功能进行测试, 判断故障点和类型。最常见的方法是环回法。对传输设备光路或电路进行环回来定位故障点。它不需要对告警和性能做太深入的分析, 缺点是会影响业务, 一般在业务量小的时候使用。

2.2 仪表测试法

仪表测试法一般用于排除传输设备外部问题以及与其它设备的对接问题。传输设备常用测试仪表包括2Mbit/s误码测试仪、S D H测试仪、光谱分析仪等。通过仪表测试法分析定位故障比较准确。缺点是对仪表有需求, 同时对维护人员的要求也较高。

3 故障排除

3.1 应用逐段环回法定位故障区段

可以通过逐段环回来进行故障的区段定位, 将故障定位在某一区段直至某一单站。一般采取光口内自环的方法来检查告警以及误码是否还存在或业务是否正常来判断, 若原来光路上有告警或误码, 自环后告警、误码消失, 则说明本端设备正常, 光路或对端设备有问题。在用一根尾纤将本站光板自环时, 要注意光板的过载点, 光发射功率超过该板过载点时要串接适当的衰耗器。实际工作中, 自环光板常会遇到一种假象:自环不通。这时可把该板重新插拔一下, 告警就会立即消失, 此为光板接触不良所致。所以光板在拔出后再插入时一定要快, 保证接触紧密、良好。如果本站光板自环正常, 可以采用O T D R进行光缆测试, 也可到对端站进行同样的光板自环检查, 排除对方光设备故障后再进行线路测试。对于串联运行的站点, 如A—B—C如果A站与C站之间有业务不通, 在A站挂仪表测试, 可以先后通过对A站电口近端环回, A站东向线路板光纤自环回、B站东向线路板光纤自环回、C站西向线路板外环回、C站对应电口远端环回来定位故障如图1。

(1) A站电口近端环回业务不通, 则说明馈线电缆、接口板或支路板故障。

(2) A站西线路板处环回业务不通, 则说明可能是A、B之间的光路或光接口的问题。

(3) 若B站西向线路板外环回业务不通, 则说明可能是A、B之间的光路或光接口问题。

(4) 若B站东向线路板光纤自环回业务不通, 则说明业务在B站穿通不行, 可能是B站线路板或交叉板的问题。

(5) 若C站西向线路板外环回业务不通则说明可能是B、C之间的光路或光接口的问题。

该方法适用于线形组网和双向复用段保护环。对单向通道保护环, 若要采取这种方法, 则必须断开一侧的光纤从另一侧逐段环回。线路板光纤自环时, 同样要注意不能过载, 要加光衰耗器。但在两纤双向复用段保护环中, 如果有一段线路侧发生故障, 且设备已进入自动保护倒换状态时, 不可用尾纤在光路各自环回的方式检测设备。因为环回时相当于自发自收一个光信号, 设备回自动解除倒换, 造成大量电路阻断, 如要做环回检测, 也需在执行Force功能的情况下才可。

3.2 采用仪表测试法判断故障

仪表测试法在日常判断处理故障时较常用, 在排仪表测试法在日常判断处理故障时较常用, 在排除传输设备外部问题以及与其他设备如程控交换机、数据通信设备、移动基站等对接问题上比较适用。比如我们怀疑某段光缆性能不好, 可使用光时域反射测试仪 (OTDR) 进行测试;如怀疑某个2 M b i t/s传输通道不好, 可使用2Mbit/s误码测试仪进行挂表测试。

4 典型案例分析

2Mbit/s接口的故障通常是最频繁的产生故障的原因也是多种多样的。如果只是2 M板告警, 可先检查是物理连接故障还是相连接的外围设备故障。物理连接故障包括:2 M头是否接触良好, 有没有虚焊、断掉, D D F (数字配线架) 连接是否正常, 电缆是否接错或不通等。排除外围设备故障可以通过在D D F架上环回和电口近端环回, 对方设备环回, 来检查交换机或其他外围设备是否正常的方法来判断。同时也要检查网管系统是否运行正常, 会不会产生误告、假告。总之, 尽量将设备外故障排除掉, 再进一步检查故障区段。

案例:故障现象:某网元2 M b i t/s业务中断, 传输设备为华为osn3500, 传输设备上有T-LOS告警。

故障分析:由于传输设备上有T-L O S告警, 系统维护者可以肯定传输设备光路没有任何问题。因为在传输设备到网元的2Mbit/s电路上有故障, 所以问题可能出在传输设备电接口板PQ1或是2Mbit/s线故障。

故障定位和解决步骤:到站先用环回的方式判断故障点, 在D D F架上做远端环回时, 传输设备仍有T-L O S告警, 做近端环回时通路正常, 说明是D D F架到PQ1板的2Mbit/s线有问题, 且是PQ1板到DDF架上的发支路故障, 与开始的分析吻合。由于PQ1板到DDF架上的2Mbit/s线是成品线, 无法修复, 只有将P Q 1板上未用的2Mbit/s成品线与故障线成功对换后, 告警消除, 放通2 M b i t/s, 业务恢复正常。为保证以后业务的正常开通, 系统维护者最后将坏的那2Mbit/s成品线换下, 以保证所有2Mbit/s线是正常的。

结论:此故障是一个典型的2Mbit/s线故障引起业务中断案例, 在这个案例中, 我们根据故障现象, 预先分析出故障属于2Mbit/s电路故障, 并由最常规的环回方式来判断故障点, 找到故障点后迅速地恢复业务。

5 故障排除的一般流程

(图2)

6 结语

在S D H传输网络的日常维护过程中我们经常会遇到各种故障现象并伴随着不同的告警指示, 有时甚至出现一样的告警指示, 貌似同一故障, 却由不同的原因导致。只有透过故障的表象找到其本质, 才能实现故障的准确定位并迅速排除。这就需要我们了解故障定位的基本原则, 明确故障处理的思路, 掌握常见的故障处理方法, 从而从容应对各种异常现象, 提高日常维护的效果。

摘要:本文详细介绍SDH设备故障分析定位的基本步骤和处理流程, 总结了SDH传输网故障的一般特点, 总结出处理的方法和流程, 对SDH网络设备的维护与管理具有一定的指导意义。

关键词:sdh传输网,故障分析,维护

参考文献

[1] Optix2500+ (metro3000) STM-16 MAD/MSTP光传输系统维护手册[M].华为技术有限公司, 2005.

[2] Zolfaghari A and Kaudel F J, Frame-work for network sur2vivability per-formance[J].IEEE J SAC, 1998, 12 (1) :46~51.

上一篇:初中语文课前预习教学初探下一篇:沉管设计在中亚输气管道上的成功应用