近日,由中国人民银行主管的中国金融信息科技主导期刊《金融电子化》杂志发表了科来《聚焦银行核心系统分布式转型的全流量解决方案》一文,该文刊登在2021年5月总第308期。

以下为《聚焦银行核心系统分布式转型的全流量解决方案》全文:

在很长一段时间内,大型机引领着计算机行业的发展,包括金融行业在内的各行业IT系统主要采用集中式架构,通过垂直扩展,增加单机配置或设备升级以提升系统的处理能力。但随着互联网的不断发展,海量高并发的业务场景、自主可控的国家战略、各行业经营模式转变等内外部因素的共同作用下,集中式架构慢慢暴露出了处理能力受限、成本控制困难、无法快速交付及风险控制等一系列问题。此时,分布式架构应运而生。


互联网飞速的发展迫使银行经营模式必须做出改变,产品推出要高质高效,客户营销要精确精准,这就要求银行的IT系统架构必须灵活、开放。银行之间竞争日趋激烈,对IT的投入要求低廉高效,而银行客户数量庞大,传统供应商提供的解决方案难以满足互联网时代业务快速发展的要求。分布式架构体系开放、高效灵活、扩展性强等优势解决了以上问题,并高度契合银行核心业务系统的发展要求,因此成为银行在数字化发展道路上不约而同的选择。

分布式架构下,“不能漏掉任何流量”


“银行核心业务系统是客户服务和交易处理的核心引擎,是银行经营和运作的“心脏”。我国大中型银行的核心业务系统大多基于主机的集中式架构,存在技术相对落后、运维成本高且难以横向扩展的问题。在当今数字化时代万物互联的大趋势下,银行面临业务量激增、交易响应快、降低运营成本、缩短产品研发周期的业务发展及技术转型压力?!?/span>


——清华大学五道口金融学院副院长????张晓燕


某股份制银行以保持核心业务逻辑不变,一次性完成核心系统分布式转型投产为根本目标。核心业务在切换及运营过程中不能出现任何差错。该行从技术上明确提出要达成不影响业务发展,继承核心银行应用资产,具备分布式应用研发和运维能力,增强系统承载能力,坚持自主可控的系统建设目标。

因此,该行创新性的采用全真场景模拟“准实战”测试,生产环境新、旧系统双机并行,增量数据迁移实现不?;葑菲?。为了实现这一目标,该行领导明确要求“不能漏掉任何流量”,要通过网络全流量的手段,建立一套高效、智能的运维体系。经过1年多生产仿真实战磨合,成功投产,打造了面向大型分布式应用的运维体系,实现360度无死角自动化运维监控。


?全流量全链路监控,确保零差错??


该行核心系统由原来的大型机平台迁移改造至X86服务器平台,需要对分布式核心系统内的APP应用、Proxy应用、文件传输平台、OMM应用、数据库等全部访问节点及所有网络关键设备流量进行全流量全链路监控,针对网络设备做到每台防火墙、负载均衡区分进网流量和出网流量,每台应用服务器主机实现全流量监控。


运维部门根据实际需求,对设备部署进行规划及实施:首先,在该行的两个数据中心分别部署近20台科来高性能处理分析设备,之后运维人员通过覆盖近30个流量采集点,实现了:


●? 针对分布式核心系统大二层的网络环境,区分所有交换机上行和下行流量。通过链路流量分析功能,实现了对每台交换机的独立监控,做到流量清晰、方向明确、定位准确。


●? 针对分布式核心系统大二层环境出现单方向流量的问题,科来通过识别VLAN标签方式,将多个单方向流量进行规划和整合,为后续的全流量监控和分析提供了基础。


●? 随着监控需求的加深,要将所有交换机上行流量或者下行流量进行合并监控??评赐ü酆狭绰贩绞?,按需任意整合不同链路流量,实现分别监控、集中监控、多段对比、关联分析的功能。


●? 应用和业务相结合,实现应用和业务层面多段对比分析??评蠢糜τ枚ㄒ搴陀τ梅肿槎ㄒ?,结合业务全流量分析,实现了应用独立监控分析、多应用组合监控分析、多应用加多网络路径相结合的监控分析效果。

?

分布式核心系统的网络业务拓扑监控效果展示(部分)


通过以上举措,该行实现了交易、业务、应用、网络等多维度的全流量、全业务路径、全协议监控,实现了监控系统主动告警、智能分析、回溯分析、监控可视化等功能。同时,国际领先的秒级精度的分析能力,帮助用户达到对业务网络高度实时化监控的要求。


网络拓扑链路质量监控

通过对分布式核心系统的核心交换机到防火墙链路、边界交换机到防火墙链路、负载均衡链路、汇聚交换机上下行接口链路的直观指标监控,当某一指标出现异常时,第一时间提示。


主动告警发现异常

可以在一个完整分布式核心系统业务逻辑视图中主动监控与发现业务异常,第一时间通知到管理人员。


业务逻辑访问质量监控分析

针对业务逻辑访问,可以通过视图可视化呈现逻辑访问关系,实现从终端发起的访问经过负载均衡—APP—Proxy—DB等全路径节点可视化监控。


可视化性能指标实时监控

网络访问拓扑监控给网络处维护人员提供了一个基于经过的网络设备路径(而不是逻辑路径)的业务访问监控视图,同时也为业务管理人员提供基于理解逻辑路径对应下实际物理访问路径的视图,业务管理员和网络维护人员可以相互补充自身监控角度的缺失和不足。


多节点智能比对分析

针对应用在网络传输经过的多个节点(汇聚或核心交换机)的性能指标情况,智能化对比每个经过节点的指标参数,智能比对异常发生的具体指标以及异常产生的路径节点和范围,提高问题定位和解决效率。


?全流量分析解决分布式架构下的运营难题 ?


银行核心系统从主机系统迁移到X86分布式平台,相当于实现了从集中式单节点到多节点架构的飞跃,原来简单的业务流转,也可能由数十台节点协同完成,甚至跨越多个集群和数据中心,运维工作量呈几何级数增长。这就需要运维人员具备新的监控体系来解决分布式架构下的运营难题。


●? 主动预警,解决故障排查时间成本增加问题

实现以网络、应用服务质量监控为基础的主动预警体系。当分布式核心系统业务的某个应用节点出现异常问题时,NPM系统将第一时间主动告警异常问题所发生的时间、发生节点、异常指标情况、问题持续时间等。


? 智能分析,解决网络运维和业务运维问题

实现异常问题发生时,多应用节点间智能比对分析。当某个应用或者业务访问关系出现异常, NPM系统快速、智能对比分析节点间的性能指标变化,结合指标统计数据存储时长和原始数据包回看时长等特点,实现异常故障快速定位、还原、分析和解决。不需要完全借助人工分析即可确定问题发生范围及严重程度。


●? 可视化监控,解决运维难度、学习曲线增大问题

建立以分布式核心系统业务为基础,通过应用全路径访问关系、网络全路径访问关系、业务全路径访问关系等不同视角,建立一套完备、直观、全局的可视化监控体系。通过监控各类可视化视图可以第一时间观察业务运行健康度,针对重点性能指标,实现指标趋势的可视化、指标预警的可视化。

?

科来业务性能解决方案整合了端到端的交互数据可视化及分析能力,实现了从故障发现到定位根源,再到追溯取证的网络故障处理,提供了对交易性能、主机性能、传输性能、网络流量等多层面的秒级精度趋势分析。凭借其主动、智能、高效的特点,从国有五大银行到各类金融机构,三百余家金融用户选择科来。

?

科来在网络流量分析技术研究与产品开发领域有着几十项专利技术和完全独立的自主知识产权。其研发的产品广泛应用于网络智能运维及安全分析等关键领域。根据全球著名咨询与分析公司Gartner的评选,2018-2019年,科来蝉联Gartner NPMD魔力象限“远见者”称号,是唯一入选“远见者”象限的中国企业。

?

–?End –

?