近年来,湖州电信按照省公司的战略部署,积极推进接入网的“光进铜退”建设,取得了显著的成效。然而,随着“光进铜退”规模的持续扩大,接入节点的数量也随之剧增,庞大的接入节点带来的电源保障、链路中断、设备故障等问题,给FTTx的日常维护和故障处理带来了不小的压力。
如何提高FTTx的维护效率、降低OPEX是摆在湖州电信面前的一道难题。为此,湖州电信与目前EPON设备主要供应商中兴通讯合作成立的课题小组,对FTTx的运维课题进行了探索和研究。
湖州电信FTTx运维面临的挑战
“光进铜退”实施之前,湖州电信的运维对象是现网的500多个母局、模块局和接入网,维护流程完善。现有网点容量大、环境好、封闭性强,有充分的后备电源保障,且有动力环境监控系统作为维护支撑,经过多年的运营管理,维护人员对现有网络的维护得心应手。
但是“光进铜退”之后,原有的维护模式面临着极大的挑战:
(1)环境保障差
接入点下移,使得接入设备走出机房,安装在各种自然场景中,温湿度、电源、网点封闭性等相比原有设备环境急剧下降,电源问题尤其突出。
(2)网点数量大
由于接入点容量介于几线到几十线之间,导致接入点数量快速膨胀,截止2009年底,湖州电信的EPON设备数量已增至4000多台,每天的故障量(掉电或光链路中断)约100个左右。
(3)故障处理流程复杂
EPON故障处理流程为:监控人员周期人工轮询EPON网管,发现节点故障或接用户申述,手工记录初步判断出的故障原因,监控人员按记录在一站式系统手工生成工单,派发相应岗位处理,同时电话通知该EPON承包区的维护人员出现场,如该节点有重要用户或需要语音拦截,还需电话通知10000号。
EPON/DSLAM故障自动处理系统
针对上述维护设备量大、故障处理流程复杂的问题,湖州电信维护技术人员自主研发了“EPON/DSLAM故障自动处理系统”。
“EPON/DSLAM故障自动处理系统”具备检测能力,相当于一个Ping工具,用于检测节点状态。系统每半小时对EPON网络轮询Ping一次,如果ONU链路中断并符合该节点已中断30分钟的条件,系统自动调用一站式接口程序,自动生成一站式工单并派发至相关岗位,同时向短信猫发送相应的命令,将中断信息发送到该承包区维护人员手机,再向10000号语音系统拦截库发送拦截信息,拦截故障用户号码;如果是重要节点(预先可通过Web页面设置),服务器还会发出声音报警,并弹出对话框提醒值班人员,整个过程自动完成,无需人工介入。
该系统于2009年11月1日上线,由于实现了故障发现、派单和通知的全程自动化,大大降低了监控人员的劳动强度,提升了工作效率。
“EPON/DSLAM故障自动处理系统”虽然解决了EPON故障监控侧的问题,但由于该系统的检测是通过轮询Ping的方式进行,实时性不高,且只能确定链路中断而无法精确判断中断原因(掉电还是光链路中断),仍需人工到现场确认,消耗了很大一部分维护人力以及车辆等资源,在接入点数量大规模增加的情况下,维护压力可想而知。
如果不仅仅能即时发现故障,并能准确判断故障原因,及时把精确的故障信息发送给一线维护人员,就能大大提升维护效率。
EasyOptical宽带服务保障系统
针对湖州电信FTTx维护上的难题,中兴通讯提出了“EasyOptical宽带服务保障系统”方案。
首先,“EasyOptical宽带服务保障系统”对EPON网络运营以来的故障进行分析和归类,整合了常规的故障诊断方法,并将其系统化、软件化、流程化。
其次,“EasyOptical宽带服务保障系统”实现与中兴EPON网管系统的对接,一旦EPON设备发生故障,该系统能在第一时间获取相关信息,结合系统内部的相关诊断算法进行综合诊断,及时准确地定位出故障原因——是局端设备故障、掉电还是光链路中断等。
第三,将诊断结果发送到“EPON/DSLAM故障自动处理系统”,由后者进行上节所述的处理。
整合后的系统被命名为“EPON服务保障系统”,结构图如图1所示。
图1 EPON故障保障系统结构图
“EPON故障保障系统”于2009年12月1日投入运行,从试运行结果看,诊断结论与实际故障原因基本吻合,准确性高,可以作为故障处理的重要依据。截至2009年12月30日,检测故障2839次,其中掉电故障比例为91.9%,光链路中断故障比例为6.5%,系统自动派发故障单及短信发送成功率均在99%以上。一般情况下,只有光链路中断引发的故障才需要维护人员出现场处理,通过以上数据可知,在准确定位故障原因后,上门维护的比例大大降低。
该系统能够即时发现故障、准确判断故障原因、及时把精确的故障信息发送给一线维护人员,从而极大地提升了维护效率,降低了运营商OPEX(运维成本)。
EPON服务保障系统的续篇
由于该系统运行时间不长,还有许多可提升的空间。
目前,该系统只实现了在故障发生之后才触发诊断并做相应处理。但作为面向未来的宽带服务保障系统,应该能在故障发生之前就给出故障预警,使维护人员对故障进行规避处理,从而减小故障发生的概率。
另外,在系统试运行期间,通过简单的统计,我们发现了不少用户的使用习惯,如某个茶吧用户,每天大约零点掉电,第二天14点恢复,说明该用户关店时切断电源。仅从维护层面来说,该掉电信息可以进行屏蔽。可以通过这种统计分析功能,对全网ONU掉电时间进行全面统计,将固定时间内断电/上电的用户筛选出来,自动进行故障单屏蔽,从而减少无效的派单。
“EPON服务保障系统”还需要提供更多的服务保障手段,以满足EPON未来的运维需求。这些功能主要包括:预警功能,包括网络设备综合性能预警、用户线路业务性能预警、用户光路性能指标预警,以及通过综合健康指数评估光路的运行性能;面向现网用户的业务属性、开通的业务量的统计分析功能,对故障解决的统计分析功能;面向用户的网络承载能力预估和配置优化功能,即在准确评估用户网络承载业务能力的基础上给出配置优化建议;支持多种标准接口,易于纳入现有运营支撑系统和对接第三方设备。
湖州电信将继续与中兴通讯携手进行深入研究,在实现智能诊断的同时,逐步部署故障预警、业务统计、用户能力评估等功能,从而不断提升EPON网络的运维效率,降低OPEX,提升用户满意度。