高中作文网

网络故障等级(精选8篇)

时间: 2023-07-09 栏目:写作范文

网络故障等级篇1

关键词: 光纤网络; 通信故障检测; 故障诊断; 数据挖掘; 决策树

中图分类号: TN711?34; TP23 文献标识码: A 文章编号: 1004?373X(2014)20?0134?03

Industrial fiber network munication fault detection system based on decision tree algorithm

HUANG Yong1, 2, HU Lian?cheng2, LIU Zeng?liang3

(1、 School of Automation, University of Science and Technology Beijing, Beijing 100083, China;

2、 Communication Network Technology Management Center of Beijing Military District, Beijing 100041, China;

3、 National Defense University of PLA China, Beijing 100091, China)

Abstract: For tedious fault detection process and low detection efficiency of industrial optical network munication, an optical fiber network munication fault detection system based on optimized decision tree data mining algorithm was designed、 In order to reduce the repeated rework of detector and realize accurate positioning, the fault data mining module taking the decision tree as the core was introduced into the system to reduce the time of fault mining in not its own space、 Only taking the IP address as a parameter in the first?order fiber?optic network fault classification is changed into the construction of decision tree based on the specified network index in the second?order classification, which further improves the accuracy of fault detection、 The application results of optical network existing in a vehicle manufacturing enterprise show that, pared with the standard method of decision tree, this algorithm has increased accuracy from 69、0% to 99、9%, and reduced the false report rate from 3、14% to 0、48%、 The optimization effect is obvious、

Keywords: fiber network; munication fault detection; fault diagnosis; data mining; decision tree

0 引 言

光纤网络支持光纤应用系统和工业生产过程之间的通信,目前主要的控制网络有楼宇自动化、工厂自动化和过程自动化[1]。控制网络有许多不同的作用和应用环境,通常部署在支持安全可靠通信的紧要使命操作环节,这样可确保光纤网络通信会话的服务质量,并使通信延迟最小。许多传统的光纤网络如基金会现场总线、数字化现场总线、ModBus现场总线等主要依靠专有协议,这些控制网络技术独立于如今蓬勃发展的以太网和基于网际协议(IP)的网络技术。但是由于以太网和IP技术的成本低廉、可扩展性强、易于维护等优势,这些网络近来也逐渐引入工业以太网和IP技术[2]。但是,当采用基于IP的控制网络技术后,将不得不面临IP网络中常见的网络问题。网络级错误和光纤网络中的错误大相迥异。网络级错误例如包重传和校验错误等是光纤网络错误的症状之一,明确的控制网络错误和网络级错误常并发于网络条件差的IP网络中[3]。因而光纤网络故障检测系统的主要需求就是能够理解网络级症状和实际错误间的关联,在此基础上设计了一套基于决策树的光纤网络通信故障检测系统,用于车辆制造企业的光纤网络。

1 光纤网络结构分析

常见的光纤网络结构是金字塔式的[4],如图 1所示。顶层的控制器驱动下层被控设备执行既定操作,最顶层的是光纤控制器(PC),一般使用人机界面,是可编程逻辑控制器(PLC)开发商提供的软硬件包,是在电脑上运行的光纤应用软件,可快捷方便地访问下层的PLC,通过开发商提供的服务器应用软件进行通信,其图形用户界面提供实时监控结果,之间的连接使用有连接的TCP协议。中层的PLC是连接光纤网络的光纤单片机,一系列复杂的控制装置或工厂流水线上的低端控制设备通过PLC上运行的定制软件程序处理运行。下层的被控设备种类繁杂,涉及传感器、制动器、电动机等设备,通过嵌入式接口接收上层PLC的命令信息。其中顶层PC和中层PLC通过以太网连接,PLC和底层的被控设备通过专有协议连接。

图1 光纤网络结构

光纤网络中的设备必须同步或顺序运行,一个微小的网络错误可能就是致命的,换言之,控制设备的一个错误可能会迫使整个生产过程耽搁甚至停滞,带来巨大的经济损失。因此,光纤网络中快速准确的故障检测举足轻重。

2 光纤网络故障检测和故障诊断

2、1 故障类型分析极其弊端

通过分析光纤网络错误的实际案例,可知其故障主要分为四类:IP连接故障、网络配置错误、物理故障、软件故障[5],其主要的故障现象如表 1所示。

目前已有的IP网络故障诊断工具如嗅探器等不具备分析光纤网络故障的能力,不能提供故障成因,而且控制网络故障的早期症状常夹杂着网络级错误。常见的IP网络指标有帧冲突、巨型帧、超短帧、循环冗余码错误帧、TCP校验错误、分片报文、重传报文、分组到达间隔时间、吞吐率、包突发,通过分析可知网络故障的报警条件,这些指标本身并不独特,但并不在大多数的商业IP网络诊断工具的分析对象之列。由于常用工具不能完全检测出控制网络故障仅能生成故障网络警报,因此需要设置新的监控分类和条件,可使用被动网络监控技术,不会影响网络运行。本文设计的检测结构的部分监测指标及报警条件如表 2所示。

表1 常见的光纤网络错误

表2 监测指标及报警条件

在每个涉及共享地址和端口的双向数据包传输的流量信息中都监测这类指标,只要出现异常就警报,因为这类指标异常只要出现就意味着发生通信故障的可能,即这类指标的突变意味着光纤网络的运行异常。网络管理员识别出早期的控制网络通信故障是非常关键的,操作者必须调查大量数据寻出网络连接异常序列,由于不同设备的控制网络有不同的通信量特性和故障案例,因此需要一个能够自动地从历史故障数据中提取故障检测规则的系统,决策树是一种非常合适的选择,可自动生成反映操作控制网络通信异常的规则用于故障检测。

2、2 决策树的引入光纤网络通信挖掘优化

传统的故障挖掘算法面临2个难题:检测时间过长,由于需要在大量网络数据中进行响应的操作,因此搜索过程极其耗时;由于冗余信息的干扰,降低了系统检测的精度。

光纤网络通信数据挖掘充当控制网络故障检测的推理机,根据检修案例、用户经验和网络测量指标,推测出故障与网络指标间的关联,这种关联被转化为故障检测规则应用于故障检测系统。决策树可以很好地解决这两个问题。

决策树用于归类有共同属性的数据[6],每一个决策树代表了一种用于区分属性的规则,主要包含内部节点、叶节点和边界。内部节点指明区分数据的属性,边界根据母节点的属性条件予以标记,叶节点根据数据划分的决策值标记,决策树已证明在网络故障检测效果较好。在控制网络中,IP地址和商品号标记结点,故障或正常标记叶名,而标注箭头定为边界。决策树根据训练数据使用信息获取函数构建,通过修剪决策树获得学习信息,这个过程会牺牲分类的精确性,如果没有网络故障则所有结点都标记为正常。修剪前后的故障决策树如图2所示。

图2 修剪前后的故障决策树

3 实用效果分析

使用国内某汽车生产公司的生产光纤网络完全的数据包跟踪,其周期为4天,光纤网络通信总数据流量是62 GB。这些流量数据被合成有共同网络特征的数据流,然后进行特征提取,相关的特征是前文提及的网络指标。分析并标记数据集中的数据流,为了便于训练和检验,每个数据流排成一行,并标记正常或者故障。表3所示为用于训练和检验步骤的示例数据,包含58 123行正常数据和3 317行故障数据。

表3 实验示例数据

为了测量决策树对于光纤网络通信网络故障识别结果的精确度,引入数据决策技术中常用来评估精确度的三个参量:精度(PV)、检索率(RP),可由精度(TP)、假阳性(FP)和假阴性(FN)计算得出,正确分选的对象数目占数目的比例为测量精度,反之为漏报率,正确对象被错误分选为其他类型则为假阴性,检索率反映被错误归类的对象比例,计算如式(1),式(2)所示。

[PV=TP(TP+FP)] (1)

[RP=TP(TP+FN)] (2)

在故障检测中,降低漏报率值是非常关键的,因为误判故障数据为正常数据将会导致发生故障造成经济损失,必须予以纠正,这也是检验故障检测技术的重要参考值。在实验1中,首先用上文提到的光纤网络通信网络指标建立决策树,并对决策树进行剪枝。实验2以IP连接的源地址和目的地址对作为特征值,对决策树进行剪枝,检验假阴性指标。实验3原理同实验2一样,只是不对决策树进行剪枝。实验4用二阶决策树分类方法,即在第一阶分类时仅以IP地址作为参量,第二阶分类时使用上文提及的网络指标为基础构建决策树。实验结果如表4所示。

表4 实验结果

由表4可知,实验1即标准的光纤网络通信决策树方法都可以保证较高的精度和检索率,这是由于控制网络的复杂度远低于正常网络,但是仍有104个漏报,比例为3、14%,这种结果是无法接受的。考虑到标准决策树算法中没有将IP地址作为决策树建立的输入参量,但是任意一个光纤网络通信网络连接都包含着两个网络设备以及源地址和目的地址,因此需要在此进行修改,即如实验2中所用的方法,将光纤网络通信源地址和目的地址引入决策树构建过程,因而成功地将假阴性树降到53个,比例为1、60%。

实验3的原理同实验2一样,只是不进行决策树剪枝,虽然增加了数据量,但是将光纤网络通信漏报数降低到45个,比例为1、355%。实验4的二阶决策树方法,虽然增加了系统复杂度,但是进一步地将漏报数目降低到16个,比例为0、48%。这个数值虽然很低,但仍然存在漏判故障,对这16个假阴性误判进行检验,发现原因是故障案例非常稀少,在整个数据集中最多出现2次,大多数仅出现1次,即使使用交叉验证也难以保证足够的训练。为了检查出16种故障,需要引入16个决策树独立规则,这虽然会增加系统复杂度和硬件消耗,但考虑到控制网络周期性地产生网络流量,故障诱因相对较少,因而只要训练数据足够多,训练较好,可以保证每一个故障都可以检测认定。

4 结 论

本文结合IP网络特点和光纤网络的特点,设计了一套基于二阶决策树数据挖掘的光纤优化故障检测系统,经过国内某车辆生产企业现用的光纤网络实用结果表明,该系统性能优越,光纤网络通信故障检测率可达到99、9%。在一定数据量的基础上,该方案可以将漏报率降低到0、48%,优化效果较为明显,取得了较好的检测效果,目前正逐步推广。

参考文献

[1] WON Y J, CHOI Mi?Jung, HONG J W、 Fault detection and diagnosis in IP?based mission critical industrial process control networks [J]、 IEEE Communications Magazine, 2008, 46(5): 172?180、

[2] AMOOEE Gloriz, MINAEI?BIDGOLI Behrouz, BAGHERI?DEHNAVI Malihe、 A parison between data mining prediction algorithms for fault detection [J]、 IJCSI International Journal of Computer Science Issues, 2011, 8(3): 425?431、

[3] ALZGHOU A, LOFSTRAND M、 Increasing availability of industrial systems through data stream mining [J]、 Computers & Industrial Engineering, 2010, 10(31): 743?748、

[4] CHEN Kai?ying, CHEN Long?sheng, CHEN Mu?chen, et al、 Using SVM based method for equipment fault detection in a thermal power plant [J]、 Computers in Industry, 2011, 2(62): 42?50、

网络故障等级篇2

[关键词]计算机局域网 故障分析 网络维护

学校计算机局域网是重要的教育教学资源,在数据获取、传输、和处理方面具有方便快捷、高效、成本低廉的特征,但网络一旦发生故障,将会导致数据获取、传输和处理等方面的障碍,影响师生正常的使用,甚至会给教学工作导致不必要的损失,因而加强学校局域网故障分析及维护研究应该成为我们广大在学校从事网络维护工作的计算机教师的重要职责。

一、计算机局域网故障

网络故障是与网络畅通相对应的一概念,计算机网络故障主要是指计算机无法实现联网或者无法实现全部联网。引起计算机网络故障的因素多种多样,但总的来说可以分为物理故障与逻辑故障,或硬件故障与软件故障。物理故障或硬件故障可以包括电源插头没有进行正常的连接,联网电脑网卡、网线、集线器、交换机、路由器等故障,计算机硬盘、内存、显示器等故障也会不同程度影响到师生正常使用网络。软件故障是当前最常见的计算机网络故障之一,常见的软件故障有网络协议问题、网络设备的配置和设置等问题造成的。

网络故障目前已经成为影响计算机网络使用稳定性的重要因素之一,加强对计算机网络故障的分析和网络维护已经成为我们在学校从事网络维护经常性的工作之一。及时进行网络故障分析和网络维护也已经成为保障网络稳定性的重要方式方法。

二、计算机局域网故障分析

计算机网络故障主要分为硬件故障和软件故障,对计算机网络故障进行分析也主要可以从硬件与软件两个方面着手:

(一)计算机网络故障分析与诊断的基本方法。计算机网络故障分析与诊断的原则可归纳为:由服务器到工作站(就是出现工作站不能入网的情况时,先确定服务器是否有问题);由外部到内部(即当有工作站出现网络故障时,先检查其外部直接可看到的设备情况,如与之相连的交换机或集线器有没有故障,电缆有无缠绕导致内部线缆断裂或接触不良);由软件到硬件(就是网络出故障后先从操作系统、网络协议、网卡驱动程序及配置上找原因。重新安装网卡驱动或网络协议、操作系统,看看故障是否消失。在确定排除软件问题后再检查硬件是否损坏)。

(二)网络硬件故障的分析与诊断方法。网络中的硬件故障比较复杂,现就日常工作中常见的网络连线问题和网卡问题来进行探讨。如,网线至交换机或集线器之间的故障分析与诊断方法,故障诊断:通过看网卡指示灯和集线器指示灯。首先,检查网线是否插好;其次,若有数台工作站同时出现网络故障,则有可能是连接这些计算机的交换机或集线器出故障。如,网卡故障,故障分析:这是最常发生的问题。如网卡设置错误,网卡在安装过程中是否正确地设置中断号,I/0端口地址,驱动程序是否出错,网卡是否出故障等。

(三)网络配置故障的分析与诊断。故障分析:网络配置故障就是由网络中的各项配置不当而产生的故障。它是一种较复杂的现象,不但要检查服务器的各项配置、工作站的各项配置,还要根据出现的错误信息和现象查出原因。如,域名、计算机名和地址故障的分析与诊断。故障分析:在实际工作中经常会出现在"网上邻居"中看不到其它计算机或只能看到部分计算机,无法找到指定的计算机等现象。故障诊断:检查网络中每个域、每台计算机的名称是否唯一;检查网络中的计算机名是否和域名或工作组名重复,使用TCP/IP时,检查分配给网络适配器的IP地址有无重复。在如协议故障的分析与诊断,故障分析:确认您所使用的协议与网络上其它计算机使用的协议相同。否则,将看不到网络上其它计算机。在配置和使用TCP/IP协议时的主要问题是IP地址、子网掩码和路由问题。IP地址的分配复杂,分配不好,容易造成网络混乱。因而,非网管人员不要随意修改IP地址。

三、计算机局域网维护

局域网维护是减少计算机网络故障,维护计算机网络稳定性的重要的方式方法。局域网维护一般来说包括以下方面:

1、对硬件的维护。首先检测联网电脑网卡、网线、集线器、交换机、路由器等故障、计算机硬盘、内存、显示器等是否能够正常运行,对临近损坏的计算机硬件要及时进行更换。同时要查看网卡是否进行了正确的安装与配置。具体来说要确定联网计算机硬件能够达到联网的基本要求,计算机配置的硬件不会与上网软件发生冲突而导致不能正常联网。

2、对软件的维护。软件维护是计算机网络维护的主要方面,具体来说主要包括:

(1)计算机网络设置的检查。具体来说检查服务器是否正常,访问是否正常,以及检查网络服务、协议是否正常。

(2)对集线器、交换器和路由器等网络设备的检查。具体来说,包括检测网络设备的运行状态,检测网络设备的系统配置。

(3)对网络安全性的检测。对网络安全性的检测主要包括,对服务器上安装的防病毒软件进行定期升级和维护,并对系统进行定期的查杀毒处理;对服务器上安装的防火墙做不定期的的系统版本升级,检测是否有非法用户入网入侵行为;对联网计算机上的数据库做安全加密处理并对加密方式和手段进行定期更新,以保障数据的安全性。

网络故障等级篇3

1总则

1、1编制目的

为保障XX市医疗保障局网络和信息安全,提高应对网络安全事件的能力,预防和减少网络安全事件造成的损失和危害,进一步完善网络安全事件应急处置机制,制定本预案。

1、2编制依据

《中华人民共和国网络安全法》、《国家网络安全事件应急预案》、《信息安全技术信息安全事件分类分级指南》(GB/Z20986-2007)、《信息安全事件管理指南》(GB/Z20985-2007)、《应急预案编制导则》(GBA29639-2013)、《信息技术服务运行维护第3部分:应急响应规范》(GBA28827、3-2012)等相关规定。

1、3工作原则

强化监测,主动防御。强化网络和信息安全防护意识,加强日常安全检测,积极主动防御,做到安全风险早发现。

明确分工,落实责任。加强网络和信息安全组织体系建设,明确网络安全应急工作权责,健全安全信息通报机制,做到安全风险早通报。

快速响应,有效处置。加强日常监管和运维,强化人力、物资、技术等基础资源储备,增强应急响应能力,做到安全问题早处置。

1、4适用范围

本预案适用于市医疗保障局网络和信息安全事件应急工作。

2事件分级与监测预警

2、1事件分类

网络安全事件分为有害程序事件、网络攻击事件、信息破坏事件、信息内容安全事件、设备设施故障、灾害性事件和其他网络安全事件。

(1)有害程序事件。包括:计算机病毒事件、蠕虫事件、特洛伊木马事件、僵尸网络事件、混合程序攻击事件、网页内嵌恶意代码事件和其他有害程序事件。

(2)网络攻击事件。包括:拒绝服务攻击事件、后门攻击事件、漏洞攻击事件、网络扫描窃听事件、网络钓鱼事件、干扰事件和其他网络攻击事件。

(3)信息破坏事件。包括:信息篡改事件、信息假冒事件、信息泄露事件、信息窃取事件、信息丢失事件和其他信息破坏事件。

(4)信息内容安全事件。指通过网络传播法律法规禁止信息,组织非法串联、煽动集会游行或炒作敏感问题并危害国家安全、社会稳定和公众利益的事件。

(5)设备设施故障。包括:软硬件自身故障、保障设施故障、人为破坏事故和其他设备设施故障。

(6)灾害性事件。指由自然灾害等其他突发事件导致的网络安全事件。

(7)其他事件。指除以上所列事件之外的网络安全事件。

2、2事件分级

按照事件性质、严重程度、可控性和影响范围等因素,将市医疗保障局网络和信息安全事件划分为四级:Ⅰ级、Ⅱ级、Ⅲ级和Ⅳ级,分别对应特别重大、重大、较大和一般安全应急事件。

(1)Ⅰ级(特别重大)。局网络和信息系统发生全局性瘫痪,事态发展超出控制能力,产生特别严重的社会影响或损害的安全事件。

(2)Ⅱ级(重大)。局网络与信息系统发生大规模瘫痪,对社会造成严重损害,需要局各科室(单位)协同处置应对的安全事件。

(3)Ⅲ级(较大)。局部分网络和信息系统瘫痪,对社会造成一定损害,事态发展在掌控之中的安全事件。

(4)Ⅳ级(一般)。局网络与信息系统受到一定程度的损坏,对社会不构成影响的安全事件。

2、3预警监测

有关科室(单位)应加强日常预警和监测,必要时应启动应急预案,同时向局网络安全和信息化领导小组(以下简称“领导小组”)通报情况。收到或发现预警信息,须及时进行技术分析、研判,根据问题的性质、危害程度,提出安全预警级别。

(1)对发生或可能发生的Ⅳ级安全事件,及时消除隐患避免产生更为严重的后果。

(2)对发生或可能发生的Ⅲ级安全事件,迅速组织技术力量,研判风险,消除影响,并将处置情况和结果报领导小组,由领导小组预警信息。

(3)对发生和可能发生的Ⅱ级安全事件,应迅速启动应急预案,召开应急工作会议,研究确定事件等级,研判事件产生的影响和发展趋势,组织技术力量进行应急处置,并将处置情况报领导小组,由领导小组预警信息。

(4)对于发生和可能发生的Ⅰ级安全事件,迅速启动应急预案,由领导小组向省医疗保障局、市委网络安全和信息化委员会办公室、市公安局通报,并在省级有关部门的指挥下开展应急处置工作,预警信息由省级有关部门。

3应急处置

3、1网页被篡改时处置流程

(1)网页由主办网站的科室(单位)负责随时密切监视显示内容。

(2)发现非法篡改时,通知技术单位派专人处理,并作好必要记录,确认清除非法信息后,重新恢复网站访问。

(3)保存有关记录及日志,排查非法信息来源。

(4)向领导小组汇报处理情况。

(5)情节严重时向公安部门报警。

3、2遭受攻击时处置流程

(1)发现网络被攻击时,立即将被攻击的服务器等设备断网隔离,并及时向领导小组通报情况。

(2)进行系统恢复或重建。

(3)保持日志记录,排查攻击来源和攻击路径。

(4)如果不能自行处理或属严重事件的,应保留记录资料并立即向公安部门报警。

3、3病毒感染处置流程

(1)发现计算机被感染上病毒后,将该机从网络上隔离。

(2)对该设备的硬盘进行数据备份。

(3)启用杀病毒软件对该机器进行杀毒处理工作。

(4)必要时重新安装操作系统。

3、4软件系统遭受攻击时处置流程

(1)重要的软件系统应做异地存储备份。

(2)遭受攻击时,应及时采取相应措施减少或降低损害,必要时关停服务,断网隔离,并立即向领导小组报告。

(3)网络安全人员排查问题,确保安全后重新部署系统。

(4)检查日志等资料,确定攻击来源。

(5)情况严重时,应保留记录资料并立即向公安部门报警。

3、5数据库安全紧急处置流程

(1)主要数据库系统应做双机热备,并存于异地。

(2)发生数据库崩溃时,立即启动备用系统。

(3)在备用系统运行的同时,尽快对故障系统进行修复。

(4)若两主备系统同时崩溃,应立即向领导小组报告,并向软硬件厂商请求支援。

(5)系统恢复后,排查原因,出具调查报告。

3、6网络中断处置流程

(1)网络中断后,立即安排人员排查原因,寻找故障点。

(2)如属线路故障,重新修复线路。

(3)如是路由器、交换机配置问题,应迅速重新导入备份配置。

(4)如是路由器、交换机等网络设备硬件故障,应立即使用备用设备,并调试通畅。

(5)如故障节点属电信部门管辖范围,立即与电信维护部门联系,要求修复。

3、7发生火灾处置流程

(1)首先确保人员安全,其次确保核心信息资产的安全,条件允许的情况下再确保一般信息资产的安全。

(2)及时疏散无关人员,拨打119报警电话。

(3)现场紧急切断电源,启动灭火装置。

(4)向领导小组报告火灾情况。

4调查与评估

(1)网络和信息安全事件应急处置结束后,由相关科室(单位)自行组织调查的,科室(单位)对事件产生的原因、影响以及责任认定进行调查,调查报告报领导小组。

(2)网络和信息安全事件应急处置结束后,对按照规定需要成立调查组的事件,由领导小组组织成立调查组,对事件产生的原因、影响及责任认定进行调查。

(3)网络和信息安全事件应急处置结束后,对产生社会影响且由省级有关部门进行调查的,按照省级有关部门的要求配合进行事件调查。

5附则

网络故障等级篇4

除了关注全球互联网对用户单位业务的积极影响之外,同时也要充分考虑到将因特网作为用户单位内部计算机网络延伸后的安全问题,若没有合适的防火墙解决方案,系统就会成为网络黑客们的众矢之的,所以恶意闯入来自四面八方,并进行某些恶意行为,例如:信息偷窃,甚至故意破坏。除了日趋严重的外部威胁以外,单位内部对系统安全构成危害的行为也在不断增加,许多系统侵入者都非常隐蔽,给网络系统安全造成潜在的很大损害,而当其所造成的危害被发现时往往已为时过晚。

网络安全的主要技术是防火墙技术(Firewall),防火墙技术的核心思想是在不安全的网间网环境中构造一个相对安全的子网环境。目前其实现方式有两种,即基于包过滤(PacketFilter)的防火墙和基于(Proxy)的防火墙。包过滤型防火墙处在网络层,根据IP包的包头信息来对信息的访问进行控制,而IP包的包头主要包括以下信息:IP包的源地址、目的地址、包类型、端口号,因此包过滤型防火墙主要完成基于地址和端口的过滤功能。基于的防火墙,也叫应用层防火墙,处于应用层,可对IP地址和发生在该IP地址上的具体应用进行控制,由于它能识别应用协议,因此可对应用的整个过程进行控制,比如在应用建立时的密码验证、在FIP应用中允许某站点get而不允许put等等。这两种防火墙各有优缺点,包过滤型防火墙由于基于网络层,因此对用户来说比较透明,但它一般采用“没被禁止的就是允许的”这一策略,在它失效时,网络是畅通的,这时内部网络将失去安全的屏障,而应用层防火墙采用“没被允许的就是禁止的”这一策略,在它失效时,内部网络与外部网络是隔离的,因此应用层防火墙要比包过滤型防火墙安全。

大多数路由器均支持包过滤功能,比如在Cisco路由器上可以通过设置称为access-list的过滤规则来实现包过滤功能:禁止外部网络对内部网络的某些重要机器的访问,禁止内部网络主机对Internet上部分站点的访问;并可利用端口号来选择控制的应用协议,比如TELNET的端口号为23、FTP的端口号为21、WWW的端口号为80等,这样就可以设置一些较复杂的规则,比如可以允许某台机器对Internet具有Email访问功能,却不能利用WWW和FIP等。

2网络容错

计算机网络系统是整个业务运行的平台,服务器是整个网络运行的心脏,它能否可靠运行直接影响到日常业务的运作。

在主服务器发生故障的情况下,备用机能自动启动为主服务器,全面代替主服务器响应全部的网络服务请求,直至主服务器被恢复。由于采用了双机模式,备份服务器和主服务器的数据和程序完全一致,不会出现数据丢失的情况。

2、1概述

近年来,计算机和网络技术的普及大大提高了我们的工作效率,但同时也给我们的工作提出了更高的要求,无论是主管领导还是网络系统管理员都要面对一些非常严峻的问题,其中最值得关注的就是系统失效问题和数据安全。

造成计算机系统失效的因素归纳起来可分为两类:一类是自然灾害(包括人为破坏);另一类是系统缺陷,即计算机系统自身的不可靠因素,如:误操作、软件缺陷、硬件老化、病毒等。电压突然波动等原因都有可能造成硬盘损坏。主要有下列两种故障:

网络设备故障:传输距离过长、设备添加与移动、传输介质的质量问题和老化都有可能造成网络故障。

2、2逻辑故障

逻辑故障包括两种,第一种是系统虽然能够正常运行,但实际已经有部分损坏,如数据文件丢失、程序丢失等。第二种是系统本身虽然完好无损,可是系统中的部分数据是错误的,这类故障的隐蔽性很强,通常难以发现,更难以修复。

常见的几种逻辑故障包括:

1)数据不完整:系统缺少完成业务所必须的数据;

2)数据不一致:系统数据是完全的,但逻辑关系不正确;

3)数据错误:系统数据是完全的,也符合逻辑关系,但数据是错误的,与实际不符。

逻辑故障隐蔽性强,往往带有巨大的破坏性,是造成损失的主要原因。系统的正常运转和数据的安全对我们如此重要,而不安全因素又不能回避。那么怎样才能提高系统的可用性?以及在遇到灾难时又如何尽快恢复系统,将损失减少到最小?

2、3措施方案

对服务器进行容错,对整个网络系统采取完善的备份措施。常言道有备无患,只有这样网络才会发挥它的效能,而不是包袱。

系统拥有好的备份系统和备份方案,可以将灾难的损失减小到最低程度。一般地,在硬件一级有磁盘镜像、磁盘阵列、双机容错等备份方案;在软件一级有热修复、数据拷贝等措施。

磁盘镜像/硬盘双工:可以防止单个硬盘的物理故障,但无法防止逻辑故障,而且当一个硬盘出现故障时,系统无法工作。对普通网络应用这是最基本的容错手段,WindowsNT和Netware均支持软件硬盘镜像,但运行时系统资源被大量占用,且不稳定,系统盘的镜像往往不能正常启动。

磁盘阵列:磁盘阵列(RAID)是一项非常优秀的容错技术,以Escort系列为例,它支持RAID0至RAID5,可以防止单个硬盘的物理故障。不但满足了容错的要求,容量可以很大且性能得以极大提升。磁盘阵列以SCSI与服务器相连,支持各种操作系统,磁盘阵列的应用解决了磁盘上的数据安全问题,对于系统级物理故障可以采取双机容错的方式。

双机容错:可以防止单台计算机的物理故障,当一台计算机出现故障时,系统仍然可以工作。数据不会丢失,备份服务器可以在很短时间内接替工作。

热修复:可以防止硬盘的区域性损坏,但无法防止逻辑故障,当出现故障时,系统予以修复后,可以继续工作。

数据拷贝:可以防止系统的物理故障,在一定程度上防止逻辑故障。

由上述可知,前四种措施可以防止一般的物理故障,在出现系统损坏(整个系统遭受灾难性打击)和逻辑故障的情况下,则需要采取第五种措施。在有严格的备份方案和计划的前提下,数据备份能够在一定程度上防止逻辑故障。然而,上述方案中没有一种措施能够使系统从大的灾难中迅速恢复出来。当灾难发生时,即使所有5种措施都采用了,仍然需要按下列步骤进行恢复:1)恢复硬件;2)重新装入操作系统;3)设置操作系统(驱动程序设置、系统设置、用户设置等);4)重新装入应用程序,进行系统设置;5)用最新的备份恢复系统数据。

即使一切顺利,这一过程也至少需要1~3天时间。这么漫长的恢复时间几乎是不可忍受的,也会严重损害企业声誉。由此可见:完善的安全的系统数据方案应有双机容错和严格的备份和灾难恢复计划。

双机容错软件针对不同的操作系统有不同软件和版本,如Novell的FSTIII、Standby,WindowsNT中有Ncr的LifekeeperforNT、Neocluster、WindowsNTmscluster,Unix环境下的容错软件有DHBS、GDS、东方龙马等等。服务器可以是任何INTEL基础上的平台,SERVER的型号、配置不必一致,只需硬件平台能保证NT运行;磁盘阵列正常使用。

3局域网防火墙及防病毒解决方案

网络安全风险分析

对于信息网所面临的安全风险涉及网络环境多方面,包括:1)自然灾害——水灾、火灾、地震等;2)电子化系统故障——系统硬件、电力系统故障等;3)人员无意识行为——编码缺陷、系统配置漏洞、误操作及无意泄漏等;4)人员蓄意行为——网络环境可用性破坏、恶意攻击等。

其中,前三个方面的风险能够通过增强对网络环境的抗自然灾害的能力、加强网络设备管理维护、系统操作管理等手段来加以完善,尽可能将风险降低到能够被控制和管理的程度。

而对于第四方面的安全风险,对整个信息网的安全环境所构成的危害最大,同时也是最难于管理与防范的。且不仅仅能够通过加强对网络环境及人员的安全管理所能够实现的,尽管安全管理非常重要。同时需要相应的安全技术手段辅助完成。这也是本安全方案所要详细阐述的。

对于在信息网环境中,采取何种安全技术手段且如何实现,就需要通过对前面提到第四方面的安全风险的分析的基础上,针对信息网安全需求来确定。

对于风险来说,它应包括那些可以被管理但又不能被清除的,以及那些能够中断网络工作流并对工作环境造成破坏性的威胁。其中,主要包括:1)对于网络应用服务的非授权访问;2)信息交互的保密性;3)网络病毒的传播与渗入;4)网络黑客行为。

通过对以上主要的网络威胁分析,能够准确把握信息网的网络安全需求。

4安全管理的两个方面

4、1内部安全管理

主要是建立内部安全管理制度,如机房管理制度、设备管理制度、安全系统管理制度、病毒防范制度、操作安全管理制度、安全事件应急制度等,并采取切实有效的措施保证制度的执行。内部安全管理主要采取行政手段和技术手段相结合的方法。

4、2网络安全管理

在网络上设置防病毒安全检测系统后,必须保证防病毒系统的设置正确,且其配置不允许被随便修改。采用用户和口令认证机制加强对用户的管理,可以通过软件本身和一些网络层的管理工具来实现。

安全方案:根据对信息网现阶段的安全需求分析,在设计安全方案时,将采取一切有力的措施,来实现信息网现阶段的安全目标,考虑到现阶段对网络病毒的管理要求,提出对网络病毒防范和管理控制建议,并提出了现阶段的网络安全管理方案。如可选用防病毒的是瑞星企业版。

网络设备的安全配置:信息网中,整个网络的安全首先要确保网络设备的安全,保证非授权用户不能访问网络任意的网络通讯设备(例如:路由器,交换机等)。对不同型号、厂家的网络设备,要防范的内容是一样的,但具体的配置方法须依照设备要求来实现。

对服务器访问的控制:对于服务器用户可以设置不同的用户权限,如“非特权”和“特权”两种访问权限,非特权访问权限允许用户在服务器上查询某些公众信息但无法对服务器进行配置,特权访问权限则允许用户对服务器进行完全的配置。

对服务器访问的控制建议使用以下的方式:1)控制台访问控制;2)限制访问空闲时间;3)口令的保护;4)多级管理员权限。

采用六级安全机制:路由器级(包过滤)、硬件防火墙级、网管级、操作系统级、数据库级、应用级,涵盖了从物理层到应用层的所有范围。

路由器级:第一道防火墙采用Cisco2811路由器实现包过滤,完成系统的访问控制功能,屏蔽掉关键服务器的MAC地址,禁止外部对内部某些重要主机的访问,同时禁止内部对外部某些站点或网络的访问。

防火墙级:系统采用Cisco公司的防火墙产品PIX520,它是一种硬件解决方案。主要优点在于,比其它防火墙方式更安全有效,而且,更好的支持多媒体信息的传输,使用与管理更方便。PIX具有双以太网口(内部网与DMZ各一个);可组成虚拟专用网并加密;在防止非法侵入的同时还可有效的限制内部对外的访问。

网管级:利用CISCO公司CISCOWORKSWINDOWS的网管功能,划分VLAN。

操作系统级:选用Windows2000SEVER或windows2003swever作为服务器操作系统,它采用了增强的安全措施,通过登陆认证、用户授权、信息加密等安全机制限制了用户对关键数据的非法操作。

数据库级(ORACLE):ORACLE支持维护管理数据库服务器、各种数据库设备,对象(包括表),用户及拥有的权限等,建立具有不同访问权限的多种类型的用户组,并能对用户进行分组授权。

Oracle完全满足NCSC的C2级安全标准,并早已通过相应的标准测试,在B1级的操作系统上,ORACLE早已提供满足NCSC的B1级或ITSEC的ITSE。

5如何实现防火墙

每一种不彻底公开的内部网络与Internet最大的区别是安全性,网络建成后,内部网与公共网之间将实现单向访问控制,通过防火墙进行隔离。防火墙技术是实现网络安全的重要保证。它可分为两种,即基于包过滤(PACKETFILTER)的网络级防火墙和基于(PROXY)的应用级防火墙。

网络故障等级篇5

关键词:P比特光网络;多故障定位;蚁群优化

随着超大容量(P比特级)光网络规模的扩大和传输速率的提高,使得网络遭受自然灾害破坏、人工操作失误和软件配置错误等多重故障的概率增加,将降低光网络带宽提供的可靠性,增加保护恢复资源配置冗余和调度的复杂性。超大容量(P比特级)光网络采用基于时空标记的分类服务方法,从时空角度对网络资源(包括路由、波长、链路、节点等)进行整合与优化。多业务端到端服务质量(Qos)需求与光网络时空多重故障生存性之间存在复杂的关系。由于光网络元素(节点、链路)的故障能够向业务流的下游节点进行传播,而使时空多重故障情况下故障管理中心收到大量的告警包。其中包含大量的冗余告警包,造成故障管理中心告警包数目急剧增多。理论已经证明,依据收到的告警包进行多故障的甄别属于非多项式完全问题(NP-pJete)问题:通常情况下得不出准确的故障发生的数目和故障发生的位置。光网络多故障定位困难可以描述为:可以在多项式时间内判定一个故障的集合是不是观测到的检测设备发出告警的原因,但是无法在多项式时间内根据观测到的告警集合推断出故障的集合。

网络拓扑复杂化和承载业务的多样性是P比特级光网络两个基本的特点,而多故障定位NP-plete问题的困难与网络拓扑和网络承载的业务相关。在P比特级光网络里多故障定位的NP-plete属性:更难寻找包含故障元素最少的故障集合和寻找包含故障元素最少的故障集合的时间与网络拓扑的输入规模成指数增长关系。由于多故障定位属于NP-pJere问题,很难得到故障的准确的数目和位置。默认的约定是:在保证推断出的故障集合一定能产生故障管理中心收到的告警情况下认为故障集合中的元素越少越是最有可能发生。已有的故障定位机制最后给出的故障集合都是在这种约束下给出的,但在这种约束条件下得到的故障集合并不一定是网络真实发生的故障,而且在这种约束下网络存在一些故障情况使得任何故障定位算法都无法处理。

1、多故障定位算法

多故障定位机制主要分为集中式和分布式,应用的光网络类型为非全光网和全光网。在非全光网中光路的中间节点对光信号进行光电转化,能够检测到故障并且可以屏蔽某些类型的故障向下游的传播。全光网中只有光路的宿节点或者所经过域的边界节点才对信号进行光电转换,才能检测到故障。一般情况下,集中式方法需要详细的网络元素模型用于故障定位,分布式机制依靠持久连接(Keep-alive)或通知消息甄别出故障的根源。

表1列出了已有的故障定位机制,透明的故障定位算法(层1)、推理算法(层1)、运行长度探测算法(层1)、启发式生成树M-cycle算法(层1、2、31属于集中式的故障定位算法,链路管理协议(层3)、端到端故障检测和定位协议(层3)、有限区域向量匹配协议(LVM)协议属于分布式故障定位协议。

研究透明光网络中故障管理的常规问题,对网络中的设备进行建模,得到每个设备可能检测到的故障和可能屏蔽的故障,然后根据得到的告警包去遍历一个告警的二叉树,最后得到可能的故障元素。该算法可应付4种故障:功率下降、波长错误部署、带内干扰、带外干扰。

研究真实环境中的多故障定位(观察到的告警可以是不可靠的)。核心问题为离散优化问题。目标是要找到故障集合和告警集合,最小化成本函数。提出了启发式算法的解决方案。该算法的复杂度集中在一个预先计算阶段,需要遍历一个二叉树。

链路管理协议(LMP)是通用多协议标记交换(GMPLS)协议栈的重要组成部分,通过在一对节点之间交换活动状态通道(Channel Active)和失效状态通道(channel FatD消息来实现不透明或透明网络中的故障定位,而不必关心编码格式。LMP协议并不单一运行在一个平面,涉及到控制平面和数据平面的协同工作。

LVM协议的核心是如果两条光路同时经过一段链路,若这两个业务的目的节点都检测到故障,就认为这个故障的链路就是这个共享风险的链路。这个协议为单故障定位设计。扩展的LVM协议支持多故障定位。

2、多故障定位问题描述

对于超大容量(P比特级)光网络,影响到故障定位复杂度的因素主要包括:多故障时空随机出现、网络复杂度(无标度网络、随机网络)、承载业务的多样性(业务种类、业务级别、QOS)。通常情况下多故障定位的目标是根据得到的告警指示,找出可能的故障集合,并且认为得到的集合(f)的故障数目越少越好。下面描述一般意义下故障定位的困难,然后阐述解决NP-plete在P比特级光网络中变得更加困难,且随着网络规模的增大定位的计算复杂度和计算时间与网络的输入规模成指数增长关系。

多故障定位的线性规划形式:

f时刻可能出现的故障集合F(t)F1,F2,F3,F4……

t时刻故障管理中心收到的告警集合A(t):a,b,c,d,e,f,g,h……

约束条件:A(Ft)+A(F2)+A(F3)+A(F4)+……=A(t)其中函数A(F)表示仅仅故障F触发的告警的集合。

目标函数:main(CTF),C=(1,O,1……)。C中元素为1或者0的列向量,目的是寻找一个包含故障数日最少的集合。

根据光网络拓扑和网络中的业务分布,我们得到如图1所示故障和告警关系的二部图。图的下面是故障管理中心收到的告警的集合,上面是可能的故障元素。故障定位的任务是根据关系图,找到一个故障的集合,使得故障集合中的故障数日最少。多故障定位可分两阶段完成:

(1)获得故障和告警的关系图。这个关系图有两个约束:光网络拓扑的约束和承载业务的分布约束。

(2)根据得到的关系图,运用有效的算法得到包含故障数最少的故障集合,其中第二阶段中寻找最少数目

的故障集合属于NP-eomplete问题。

多故障定位的目标是寻找包含故障数目最少的故障集合。即使能够寻找到计算性能优良的启发式算法解决了NP-plete的困难,但是最少数目的故障集合可能不止一个,如何选择和处理这些集合仍困难。况且最少数目的故障集合并不一定是真实网络中一定发生的故障,网络管理者只是认为最少数目的故障集合更有理由发生。

多故障时空随机出现、网络复杂化(无标度网络、随机网络)、承载业务的多样性是P比特级光网络的显著特征。其中网络复杂化(无标度网络、随机网络)、承载业务的多样性增加了多故障定位第一个阶段的复杂度,使得获得的故障和告警的关系图更加复杂、耗时,而且得到的关系图不再是静态而是动态变化的。多故障时空随机出现增加了多故障定位的第二个阶段的复杂度,因为收到的告警包是随机达到故障管理中心的,不同的告警集合及故障集合有着明显的区别,如何处理告警包的随机性,成为研究的关键。

3、模糊故障定位和蚁群优化

为了解决P比特级光网络对多故障定位两阶段带来的影响,本文针对每个阶段提出了各自的优化策略:故障和告警关系的模糊化(第一阶段)、蚁群优化算法(第二阶段)。

由于承载业务的多样性使得获得的故障和告警的关系图更加复杂并且是动态变化的,此时故障和告警的关系不再是确定性的必然事件。我们用模糊数学的隶属关系来描述故障和告警,告警是在一定程度上隶属于触发它的故障,得出这样的结论的依据是:

(1)承载业务的多样性、业务动态的拆建使得故障管理中心无法实时地得到下游的节点告警,告警和故障的关系不再是确定性关系。而根据业务到达的分布,可以得到告警和故障的隶属度。

(2)网络复杂化(无标度网络、随机网络)使得业务的路由多样化。相同源和宿业务的路由在不同时刻有着不同的路由,使得故障和告警的关系图动态变化。基于路由的多样性,可以得到告警和故障的隶属度。

(3)随着网络的运行时间的增长,伴随着故障定位问题的成功和失败,可以根据以往成功的经验建立专家系统。这个专家系统需要能够很好地描述网络故障和告警的关系。

隶属函数是模糊故障定位的基石,已有隶属函数的确定方法:

(1)模糊统计法

模糊统计法的基本思想是对论域上的一个确定元素是否属于论域上的一个可变动的清晰集合做出清晰的判断。

(2)例证法

例证法的主要思想是从已知有限个μA的值,来估计论域μ上的模糊子集A的隶属函数。

(3)专家经验法

专家经验法是根据专家的实际经验给出模糊信息的处理算式或相应权系数值来确定隶属函数的一种方法。在许多情况下,经常是初步确定粗略的隶属函数,然后再通过学习和实践检验逐步修改和完善,而实际效果正是检验和调整隶属函数的依据。

这样在得到的故障和告警的关系图中,故障和告警之间不再是确定的关系,每条故障和告警之间的连接都将赋予一个隶属度(0~1),这个隶属度反映网络拓扑和业务分布在一段时间内对告警和故障关系的影响。我们采用例证法来进行隶属度的计算。蚁群算法(ACO)是一种基于种遍历所有告警群的启发式仿生进化算法。ACO已经成功用于解决许多组合优化问题,最早的应用就是解决旅行推销员、货郎问题(TSP)问题。蚁群算法是对自然界蚂蚁的觅食寻路方式进行模拟而得出的一种仿生算法,充分利用了选择、更新和协调的优化机制。即通过个体之间的信息交流与相互协作最终找到最优解,使它具有很强的发现较优解的能力。假如将告警作为图的节点,而故障作为经过的链路,多故障定位很容易转化为旅行售货商问题。蚂蚁经过一个告警并为这个告警选择相应的产生此告警的故障。当所有蚂蚁遍历所有的告警后,就得到故障的一个集合。蚂蚁释放的信息素与故障集合的元素的个数成反比,故障元素的数目越少。释放的信息素越多。启发式信息与每个故障节点的度成正比。

4、仿真验证

本文在波长交换光网络(WSON)仿真平台上实现模糊隶属关系和蚁群优化算法的多故障定位。平台基本功能采用了IETF的GMPLS协议。COST239仿真拓扑如图2所示。有11个物理链路节点和25条物理链路。网络类型为全光网(只有每条光路的宿节点或者域的边界节点可以检测到故障)。仿真仅仅考虑链路故障。1~25条物理链路上随机的3条链路出现故障。产生故障的光路的宿节点都能够检测到故障。物理拓扑上任意两个节点承载的业务采用泊松分布。业务的路由采用D算法实现,不考虑资源约束。方案旨在验证多故障定位方案。仿真结果如图3所示,分别进行了蚁群多故障和扩展的LvM协议多故障定位。红黑曲线计算多故障定位成功率的方式为故障数目和定位的故障与预先设置的故障数目和故障完全一致则认为多故障定位成功,否则失败。蓝绿曲线计算多故障定位成功率的方式为成功的故障数目除以得到的故障集合的故障数目。左边的仿真结果图为3故障,右边的仿真结果图为4故障,从成功率对比可以看出,随着故障数目的增加,蚁群要逐渐优于扩展的LVM协议,在大规模和多故障情况下,蚁群算法能取得更优的性能。

网络故障等级篇6

【关键词】电力调度 自动化系统 安全隐患 防治对策

【中图分类号】TM734 【文献标识码】A 【文章编号】1672-5158(2012)11-0306-01

当前,电力调度自动化系统网络安全隐患日益增多,电力系统的良好运行造成了较为严重的影响。新时期下,电力部门只有充分认识到电力调度自动化系统网络安全的重要性,认真分析原因,深入探讨对策,及时采取安全防护技术手段,建立严密的安全管理措施,才能确保电力调度系统和电力系统的安全。笔者在本文中分析了当前电力调度自动化网络存在的安全隐患,并在此基础上提出了相关防治对策,希望对广大业内同行有所借鉴帮助。

1、电力调度自动化系统网络存在的安全隐患

总体来说,电力调度自动化系统网络主要存在存在物理安全、网络安全、系统安全、应用安全、人员管理等五个方面。

物理安全主要包含主机硬件和物理线路的安全问题,如自然灾害、硬件故障、盗用、偷窃等,由于此类隐患而导致重要数据、口令及帐号丢失,称为物理安全。网络安全是指网络层面的安全。由于联网计算机能被网上任何一台主机攻击,而网络安全措施不到位导致的安全问题。系统安全是指主机操作系统层面的安全。包括系统存取授权设置、帐号口令设置、安全管理设置等安全问题,如未授权存取、越权使用、泄密、用户拒绝系统管理、损害系统的完整性等。应用安全是指主机系统上应用软件层面的安全。如Web服务器、Proxy服务器、数据库等的安全问题。人员管理是指如何防止内部人员对网络和系统的攻击及误用等。

目前,电力调度自动化系统网络存在的安全隐患主要是自然灾害、硬件故障、盗用、偷窃等方面,这些情况对电力调度存在着非常严重的损坏。—是自然灾害。常见的对电力调度自动化系统网络造成影响的自然灾害有地震、火山、滑坡,泥石流、台风、雷击等。自然灾害可谓是天灾人祸,这是无法避免的,我们能做的就是提前预测,并根据预测结果进行防范,使受灾程度减到最小。二是硬件故障。硬件故障是技术硬件问题,如网络安全访问控制技术,加密通信技术、身份认证技术、备份和恢复技术等。其中网络安全访问控制技术和加密通信技术的故障主要表现为黑客的攻击和病毒的侵扰,导致网络信息丢失,系统瘫痪;身份认证技术的故障主要表现为用户拒绝系统管理、损害系统的完整性等。

2、电力调度自动化系统网络安全防控措施

近年来,电力调度自动化系统的内涵有了较快的延伸,由原来单一的EMS系统扩展为EMS、DMS、TMS、厂站自动化、水调自动化、雷电监视、故障录波远传、功角遥测、电力技术支持系统和调度生产管理系统等。数据网络是支持调度自动化系统的重要技术平台,一般要求数据网络安全可靠,实时性要求在秒级或数秒级,其中发电报价系统、市场信息等电力市场信息系统由于需要与公网连接,因而还要求做加密及隔离处理。具体来说,要从以下方面来加强电力调度自动化系统网络的安全防护。

(1)提高调度人员综合能力素质。随着新技术、新设备的不断应用,电力调度自动化系统对调度人员的业务素质也提出了更高要求。因此,要求调度人员不断学习新技术、新知识,提高业务技能,以胜任本职工作。培训工作应以实用为目标,突出技能训练和注重岗位练兵。要熟悉电力调度自动化系统的一次系统图、主要设备的工作原理,熟悉调度自动化系统的工作原理、电网继电保护配置方案及工作原理,熟悉电力调度自动化系统的各种运行方式的操作和事故处理及本岗位的规程制度。同时,要能正确下令进行倒闸操作、正确投退继电保护及安全自动装置,运用自动化系统准确分析电力调度自动化系统运行情况,能及时准确判断和排除故障,尽可能缩小事故范围。电力调度自动化系统调度人员只有通过各种形式的培训学习,苦练过硬的本领,才能在指挥电统的运行和事故处理中做到准确无误。

(2)严格遵守各种安全规章制度。在具体工作中,调度人员要成自觉认真执行规程制度的习惯,克服习惯性违章。如调度员在受理线路工作票时,必须严格把关,仔细认真地进行审查,对工作票所列任务、安全措施及要求,逐项审核,不合格的工作票必须重新办理;下倒闸操作命令,术语要规范,并严格执行调度命令票制度。同时,要熟悉掌握运行方式,做好事故预想。调度员要对电力调度自动化系统的运行方式、主设备的运行状况和当班需要完成的工作,做到心中有数,并针对当时天气、运行方式和主要工作,做好事故预想,提前做好应对措施,以便在发生异常时,能够及时果断进行处理,杜绝误调度事故的发生。

(3)制定科学的自动化调度防护策略。由于当前我国电力调度自动化系统由单一的EMS系统扩展为EMS、DMS、TMS、厂站自动化、水调自动化、雷电监视、故障录波远传、功角遥测、电力市场技术支持系统和调度生产管理系统等。网络数据的安全已经从原来的基本保护升级到了重点保护的水平,而且网络数据安全的可靠性的实时性也从秒分级上升到毫秒级的水平。特别是发电报价系统、市场信息等电力市场信息系统由于需要与公网连接,因而还要求救加密及隔离处理。因此,电力调度自动化系统需要建立起一整套安全防护体系,这首先要制定其安全防护的策略。从大的方面讲,安全策略决定了一个系统要达到的安全级别及可以付出的代价;从小的方面讲,安全策略的具体规则用于说明哪些行为是允许的,哪些行为是禁止的。

(4)建立健全安全防护责任制。对于硬件的故障,要及时制定安全应急措施和故障恢复措施,对关键数据做好备份并妥善存放,及时升级防病毒软件及安装操作系统漏洞修补程序。加强对电子邮件的管理,在关键部位配备攻击监测与告警设施,提高安全防护的主动性。在遭到黑客、病毒攻击和其他人为破坏等晴况后,必须及时采取安全应急措施,保护现场,尽快恢复系统运行,防止事故扩大,并立即向上级电力调度机构和本地信息安全主管部门报告。对盗用、偷窃。对盗用、偷窃现象,要采取建立健全分级负责的安全防护责任制。发电厂、变电站等负责所属范围内计算机及信息网络的安全管理,各级电力调度机构负责本地电力监控系统及本级电力调度数据网络的安全管理,相关单位应设置电力监控系统和调度数据网络的安全防护小组或专职人员,相关人员应参加安全技术培训和素质教育。单位主要负责人为安全防护第一责任人,总体上负责整个网络系统的安全。

网络故障等级篇7

关键词:电力通信;通信网络;故障;问题;建议

1、引言

随着电网的发展,电力通信网络技术与电网技术的融合越来越密切,电力通信网络是支撑电网调度运行和公司管理信息化的重要基础设施。电力光纤通信网络通过近几年的建设已具一定规模,220kV、110kV、35kV变电站之间,通过不同电压等级线路和其他可利用走廊组织了OPGW、ADSS或普通光缆,以形成以贡献通信为主,微波、载波为辅,多种传输方式并存的通信网络。光传输网络部分节点之间已形成环网运行,提升了运行安全、稳定及可靠性,但仍有不少节点以串行分支链路接入环网方式运行,在物理拓扑上不能满足N-1要求。支链上的网络接点,一旦设备发生故障,不仅仅中断本站点的业务,还会造成其它站点的业务传输中断,甚至造成较大面积的影响。电力通信光传输网络有待进一步完善和加强。

2、地县级地区通信网络薄落、容灾能力差

地县级地区通信网络薄落、容灾能力差,主要体现在光纤覆盖率和数据网覆盖率两类指标。目前地县级电网通信网络基本为单汇聚结构,地调光传输网络只有一个汇聚点,存在单点故障风险。调度数据网、调度电话、综合数据网等业务均为集中型业务,均在地调落地。在地调主调失效的情况下,这些上下级互联的业务将中断。近年来,各类事故、自然灾害和社会突发事件频发,电力通信调度应急越来越频繁。随着城乡电网的发展,地县级电网调度控制业务对实时数据备用、技术支持系统备用和实时调度业务备用的需求不断提高,因此迫切需要加强地县级备用调度建设,提高电力通信网络防范各类风险的能力。

实现地县级调度备用功能,需要建立覆盖相关调度和变电站的电力通信网络和调度数据网络,通过选择合适的网络第二汇聚点,将关键业务形成双汇聚结构,在地调或主调业务失效的情况下,关键业务信息仍可以通过第二汇聚点进行传送来实现。其建设原则及相关建议如下:

(1)地县通信网设立第二汇聚点,在第一汇聚点(主调)失效的情况下,第二汇聚点无需通过第一汇聚点仍可实现对各调度对象的信息(数据语音、通信设备状态等)的可靠信息采集。

(2)第二汇聚点优先考虑光缆资源丰富、便于同其它通信节点相连和汇聚业务、可直接连接至上级通信网并与第一汇聚点保持适当距离的站点。建议在地县级电网的重要节点、光缆出现较多、通道组织迂回路由多的站点综合考虑选择。对于单级星型结构的县级网络,可考虑在县城内构件小型环网,在小环网上设置第二汇聚点。

(3)第一、第二汇聚点能够分别独立到达辖区内的各调度对象,并且能够分别独立通达上一级的两个汇聚点,形成逐级上汇聚、上下两级双汇聚点之间交叉连接的高可靠通信容灾网络架构。

(4)考虑所涉及到的各类业务通过第二汇聚点的流量,合理确定所需宽带和发展余量,避免发生网络拥塞或闲置浪费。

(5)除满足业务需求外,还应满足在备调对通信网络进行监控、管理的功能要求。

3、SDH光传输设备故障致通信业务中断严重

电力通信网络主要基于SDH光传输设备形成,SDH光传输设备是一种将复接、线路传输及交换功能融为一体、并由统一网管系统操作的综合信息传送网络的设备,它可实现网络有效管理、实时业务监控、动态网络维护、不同厂商设备间的互通等多项功能,能大大提高网络资源利用率、降低管理及维护费用、实现灵活可靠和高效的网络运行与维护,是在电力通信光纤网络中必不可缺的设备。

根据统计分析,在电力通信网络实际运行中,SDH光传输设备频率较高的故障有三种:光板故障、主控及交叉板故障、电源模块故障。光板故障、主控及交叉板故障可以统称为单盘故障,主要体现在器件损坏或由于环境、湿度等影响板件正常工作等情况;电源模块故障包括交流停电,设备直流掉电及熔断器故障等。除以上提到的故障外,其它比较常见的故障还有:电缆故障,包括2M或音频电缆终端、DDF架侧2M线接口输入/输出端口脱落或者松动而造成的接触不良;网管系统故障,包括网管与设备之间的网线故障或者系统异常而造成的ECC通道中断、死机等情况;尾纤故障,包括尾纤断裂、弯曲半径过小、法兰盘接头有灰尘及尾纤头脏等。随着通信网络的扩大机设备投运时间的增长,SDH光传输设备光板故障呈上升趋势。

此类设备故障的防范,建议从以下几个方面加以预防:

(1)加强通信网管系统的监视和现场巡视,掌控光纤通信设备的运行状况和健康水平,从设备参数指标的劣化提前判断可能出现的故障,并及时消除。

(2)加强通信设备的备件管理,保证备品备件充足到位。

(3)把串行分支链路接入环网运行方式改成小环网接入大环网运行的方式,建设环网自愈功能,这样任一站点的SDH设备发生故障,仅仅中断该站点业务,光环网解环成单方向运行状态,不会造成其余站点运行业务的中断。

(4)建立双环网络的运行模式(A网络和B网络),通过不同的SDH光传输设备网络,形成主、备通通且互为备用,即使某站点的A网络设备发生故障,该站点业务还可以通过B网络设备通道传输。

在日常的设备维护过程中,应及时做好设备的数据备份工作,确保备份数据及时更新,SDH光传输设备一旦发生故障,应立即采取应急措施,避免事件扩大,迅速有效的恢复设备运行,确保光纤通信电路的安全稳定运行。若短时间内无法修复,应及时调整迂回电路对中断业务进行调整,优先保证自动化及保护通道。设备故障得到处理后,确认所有中断业务均已恢复,并经网管监视稳定运行一小时以上。

4、外力破坏通信光缆事件严重

随着电力光纤通信网络的发展,外力破坏光缆事件日益增多。由于光缆抢修受各种条件制约,如天气影响、申请停电时间、光缆配套金具材料是否及时供货等,导致修复时间长,故障一旦发生,具有中断面积大、影响广、恢复时间长的特点,给电力安全生产带来极大危害。

纵观近几年光缆中断事故分析,外力破坏光缆主要体现为以下两种:

(1)市政施工破坏光缆:此类故障主要发生在城区,一旦事故发生,通常情况下管孔内光缆全部破坏。由于施工现场复杂,通常要耗费大量时间才能寻找到光缆断点,恢复出路困难,通道中断时间一般较长。

(2)光缆纤芯中断:主要体现在早期建设的光缆在架(敷)设前,未严格执行光缆盘测,或在施工中未执行操作规范,造成光缆纤芯存在损伤,存在安全隐患。在光缆运行一段时间后,因潜在损伤发生劣变,导致光缆中断。随着时间的退后,此类故障估计在今后几年内会有上升。

光缆施工规范化、运行的安全保护期均有待加强,防范此类故障,建议从以下方面加强防护:

(1)光缆施工时,严格按照相关施工规范操作,进行标准化施工。

(2)工程验收时,严格按照光纤工程竣工验收规范进行验收,特别对于光缆纤芯,要进行纤芯两端测试,确保指标优良。

(3)加强通信网络建设,提高通信网络的可靠性,实现电力网络“N-1”的网架结构。

(4)加强光缆巡视,加强电力通信设施保护宣传力度和执行力度。

5、通信电源系统故障影响通信网络安全稳定运行

在发生交流电源中断故障,通信设备转由蓄电池供电,为了尽可能长时间维持通信系统的最低可用状态,可以采取以下措施:

(1)定期进行蓄电池核对性放电试验,全面了解蓄电池工作状态。

(2)密切监视蓄电池的放电情况,随时了解交流恢复供电时间,测算蓄电池放电容量。若短时间交流电源不能回复,可逐渐退出一些设备,如图像监控系统、调度录音系统等,避免出线蓄电池过渡放电或者突然失电对设备及软件生产破坏性影响。

(3)交流电源来电后,按照业务的重要性进行启动。启动过程中,应密切关注运行情况,随时准备处理可能出现的问题。

网络故障等级篇8

关键词 SDH;维护;故障;定位

中图分类号TP393 文献标识码A 文章编号 1674-6708(2011)37-0233-02

SDH(Synchronous Digital Hierarchy),即同步数字体系,是目前在电力通信行业得到了广泛运用的技术之一。SDH是一个技术体制,主要涉及为不同速度的数位信号传输提供相应等级的信息结构,包括复用方法和映射方法,以及相关的同步方法。

目前在区域电力通信网络中,SDH网络基本已经可以覆盖到整个网络。为了能够保证SDH网络设备能够更好地服务,确保光纤传输网络的正常运作,需要根据SDH的自身特点,对其进行必要的维护以及检修和故障排除工作,通常而言,可以将工作内容进行归纳为以下部分:

1)SDH网络的日常维护工作

对于任何工作设备而言,维护工作都是保证其正常工作的必要环节。对于SDH网络系统,应当根据整个网络中不同设备的具体状况而实施有针对性的维护检查。

对于SDH网络的维护工作,可以从两个方面着手,即相关设备的检查和相关网管的检查。其中,相关设备的检查方面,以SDH网络涉及的主要设备为主要检查对象,并根据其自身状况进行维护。主要包括设备告警以及机柜指示灯检查,设备告警主要对告警设备以及其发声状况进行检查,由于设备告警关系着对于网络故障的及时发现,而机柜指示灯则能够明确标识出机柜的运作状况,因此每天都应当对其进行检查。此外,单板指示灯也是一个极为重要的检查维护环节,应当依据设备状况及时进行检查维护,通常采取一天两次检查为宜。设备检查中还应当 包括风扇检查和防尘网的定期清理,主要依据实际情况,保持设备通风和微环境的散热通风,通常可以以半个月为一个周期,视尘土的堆积情况进行清理。

网管检查中应当从SDH网络的软环境进行着手,首先是对软环境的安全管理,应当对登录口令定期进行更改和备忘登记,通常一个月更换1次~2次,以能够确保安全为主,同时应当加强对于SDH网络系统的人员安全管理,防止口令流失。其次,应当从SDH软环境开始对其内部状态以及安全运行进行检测维护,主要包括对于导航树以及拓扑图的监视,确保其软环境的正确识别;以及告警和性能的监视,确保系统内部正常运行。这些都是需要每天对其进行监视维护的,也可以针对系统设计一些简单的代码软件,对整个系统进行实时监控。此外,还需要不定期地针对系统配置以及操作日志进行检查,同时根据系统的运行状况进行数据备份,防止意外发生的时候难以快速回复系统运行。

2)SDH网络的故障维护工作

通常而言,SDH的故障维护并不十分困难,但是在这个过程中,故障的定位是一个十分重要的环节。在实际工作中,需要快速准确地将系统的故障定位到网元。在SDH系统中,由于网元之间的距离巨大,因此有效定位故障,对于提高维护效率有着重大意义。如果反复奔走于不同的网元之间对故障进行测度,将会在人力物力等多方面造成不可低估的浪费。

在对SDH网络故障进行定位的时候,有如下几个方面需要优先考虑:首先是SDH设备外部因素,因为相对而言,SDH网络中更容易发生线路故障或者接头、电源以及其他接入设备或接口故障。其次,在故障定位的过程中,需要先将故障定位在单站中,然后再逐步具体到单板和网元。此外,对于报警的级别必须予以深入分析,抓网络中的主要问题,对于较高级的报警应当给予更多的重视,而对于低级别告警,则应当为高级别告警让路。

常见的故障定位的方法包括:

(1)报警线索分析

对于系统内部的报警信号,相关的网管职能通常都会对报警事件进行记录,其中包括对于事件发生时间、事件发生前后系统工作状况数据等。根据这些信息,结合SDH系统帧结构中的相关字节和报警机制,通常就可以对系统中的故障进行初步定位。

需要注意的是,这种方法可能存在一定的误判,由于报警机制本身的不完善或者是报警设备的局限性,很可能导致对故障定位方向的错误,对于这一问题,应当在故障定位的时候多进行主管思考,并且结合以往故障实例进行综合判断。因此,对于故障资料进行记录和整理也是SDH系统维护中的重要工作。此外,能够参考的数据还包括事件发生前后的系统运作日志数据,这些数据从一定程度上反应着系统的运行状况,甚至包含有故障的触发原因,必须予以重视,应当对其整理,记录并长期观察。

(2)环回法对于SDH系统故障的定位

环回法是SDH系统中用于定位故障最常用的方法之一,对于分析报警原因失败的故障常常采用这一方法进行深入定位。

环回法是针对不同故障通路进行检测的一种故障定位方法,它能够在报警分析失败的情况下进行定位,但是对于SDH的运行会有一定的影响。需要注意的是,环回法需要首先对不同的通路进行测试,而不是同时对产生故障的大范围系统进行测试。对此,需要工作人员首先从产生故障的局部系统中选取一个网元,并且在这个网元中选取不同通路逐一进行测试,这样才能得到真正有效地测试结果。

应当注意,环回法虽然能够对SDH故障进行定位而无需报警信号和相关数据的帮助,但是它的精确度却存在一定不足,并且对于环回法的使用,也存在褒贬不一的论调,主要原因是它的使用会影响SDH系统的正常工作,因此除非大范围发生故障,通常对这种定位故障的方法不予采用,这也是从一定层面上基于故障排除效率的考虑。

(3)替换法对于SDH系统故障的定位

替换法是在SDH系统发生故障的时候,对于怀疑故障的设备或原件,甚至是目前工作的配置加以更换的测试方法。这种测试方法更多地应用于对于外部小范围内故障的定位和测试,例如光纤、中继电缆、交换机以及接口等设备。

    【写作范文】栏目
  • 上一篇:干部述职方案(精选8篇)
  • 下一篇:****学生自我评价(精选7篇)
  • 相关文章

    推荐文章

    本站专题