主动式监测动力引擎技术可靠性分析
监测动力引擎,作为主动式监测的核心它的好坏直接决定整个监控平台的质量.
工作的稳定性
监控平台一旦在客户生产环境中部署就要担负起率先发现IT系统中故障的责任,而IT系统对于许多客户的业务通常起着至关重要的作用.客户在部署监控平台之初也往往对其寄于厚望.如果监控平台自身不能长期稳定的工作,其给客户带来的价值也就会大打折扣,监控平台的职责就是要发现IT系统中软硬件的故障如果其本身经常出现问题不能稳定的工作,那么就更谈不上对其它系统的监控了,所以稳定性是评价一个监测动力引擎的首要指标。
监测的可靠性
这里是指监测结果的可靠性.正确的监测结果是监控平台工作的基石.监控平台能产生的所有事件,报表,报警都是以动力引擎生成的每一条监测结果作为基础的.如果没有可靠的监测结果就不会有正确的事件,报表,和报警.不能得到正确的报表和报警对于客户来说监控平台就失去存在的意义了.所以监测结果的可靠性也是衡量一个监测动力引擎的核心指标。
性能
一个好的动力引擎除了要具备上述两个必要条件其性能的好坏也很重要,如果一个监控平台只添加很少数量的监控对像就把机器的资源消耗殆尽是很难称的上是一个好的监控平台的.这样的平台不但对资源是一种浪费,更增加了客户的部署成本和管理成本,也不是一种环保的解决方案.而整个平台性能的好坏很大程度上取决于动力引擎的性能。
监测的最小调度频率
由于关键业务的重要性,客户对于某些核心设备(如:核心路由器、交换机,以及运行着关键业务的服务器等)和业务的监控已经不满足于分钟级别的监测,客户需要更加及时地获得这些设备的工作状态。好的监控平台要能做到在最短的时间发现问题所在,越早发现故障就越能为客户避免重大损失,这就要求动力引擎能提供的调度频率越快越好。
美信IT业务管理软件采用自主开发的业界领先的TaskDispatcher复杂任务分发技术,把监测颗粒度从分钟级缩减到秒级,以保证监测数据的实时性和精确性。用户可以设置监测频率的间隔为5秒、10秒、15秒到30秒(5秒的倍数任意设置)。这样当客户关键设备出现异常时能在第一时间里发现问题,发出报警,为客户解决问题赢得宝贵的时间。
适用范围:对故障响应实时性要求很高的客户,如运营商、银行、加油站、高速公路收费站等。
可扩展性
客户实际环境中在监控平台部署完成后IT设备还会逐渐增加,系统规模会越来越大,监控平台的压力自然也会随之增加,时间长了总会超过当初部署时监控系统的设计能力,在这种情况下往往只有两种选择,一种是再购买一套新的监控系统部署到另一台机器上,形成两套或多套独立并行运行的状况这样做的结果是增加了客户的维护工作量,每套系统都要单独设置权限,报告,报表,报警,并且不能从一个界面进行访问和管理.时间越长给客户带来的不便就越大.而另一种方案是在原有的系统上扩展,这样做只要多增加硬件监测机既可,所有的设置都在同一套系统中进行用户仍然通过同一套界面进行访问和管理丝毫感觉不到后台的变化.要想满足第二种方案就需要监测动力引擎具有很好的可扩展性。
综上所述要研发一个优秀的动力引擎就需要在上述五个指标是必须要考虑的
主动式监测动力引擎-TaskDispatche,在设计之初就是按照最大程度满足上述五个指标进行的,并在以后的研发和测试中始终以提高这些指标为核心目的。事实证明TaskDispatcher果然不负重望,在以上各个指标中均取得了优异的成绩。它的稳定性和可靠性在大量的客户群中得到证明,赢得客户的口碑,其性能也在拥有众多服务器的中石油总部等大客户获得检验;而它的最小调度频率更是达到秒级,这在国际上同类产品中也不多见,更为难得的是在调度大量秒级监测的同时还能保证资源的最小消耗。美信管理平台良好的可扩展性达到了一套系统可监测超过十万台设备的水平,并且还完美实现了多机负载均衡,智能监测任务分配,当其中一台或多台机器宕机时,其它机器会自动负载起它们的监测任务,最大程度上保证被监测设备始终处于被监控状态,从而为高性能的美信IT管理平台的提供了一个优良的心脏。
评论