随着银行业务模式的变革,IT架构也在不断演进,各个银行开始分批次完成业务系统的云化、容器化、微服务化,系统架构变得更加复杂,运维工作也面临着巨大挑战。一方面,“关注业务”成为运维部门发展的必然诉求,IT即业务的理念(IT系统成为了业务发展的必需构件)已被广泛认知,因此如何确保IT系统持续、稳定的运行,先于业务部门发现并解决问题,成为运维部门工作探索的重点方向。另一方面,运维组织规模的扩大难以跟上大规模复杂IT系统运维难度的提升速度,进而促使机器学习等人工智能技术及自动化技术在运维领域落地成为刚需(即如何运用“异常检测、根因分析、趋势预测、关联分析”等算法于运维工作中),这对运维体系建设工作提出了更高的挑战。在当前背景下,银行业的运维工作面临以下痛点:
1. 无法聚焦“业务连续性”:需要从整体终端用户体验入手,将关注重点从应用、服务、中间件转变为业务以及场景。
2. 难以落地“指标管理体系”:需要跳出纯粹资源运维的思路,从业务生命周期的角度,扩充更多运营类指标(如用户粘性、业务健康度),而不仅仅是CPU、内存、Kaiyun电竞磁盘容量等运维指标。
3. 监控类型繁多、数据形态复杂:业务系统的架构复杂、技术栈多样、建设时期不同,导致相应的监控工具类型繁多数据形态复杂。例如,微服务改造后产生的调用链数据,与传统的“磁盘使用超90%”告警如何进行统一。
4. 监控数据源多、技术指标孤立:“业务”作为隐藏的线索,其串联的各种指标,并不能很好的被统一监控,更难以被进一步挖掘出价值。例如中间件“响应时间”数据,不能与“用户请求成功率”的一次异动,快速的被关联分析后自动发现其中的逻辑关系。
5. 难以统一的可视化管理:当前信息的输出格式,更多的是文字式的报告报表,并且对于异常的通知也只能达到实时的告警。因此,对一些有明确逻辑业务场景中的异常,需要结合静态或动态的调用关系进行分析,并以多元化视图的方式进行一定提前量的预警。
云智慧的银行智慧运营中心方案,能够满足数据采集技术、大数据存储技术、大规模数据离线计算分析、数据治理、指标体系、异常检测技术等需求,实践平台化思维,充分利用现有监控资源实现了复杂业务模型下的告警策略、故障管理、Kaiyun电竞数据分享、决策分析等功能,并构建出完整的技术生态体系,帮助客户提升整体的IT运营服务能力。该方案的架构如下图所示:
本方案为企业的解决方案,集监、管、控为一体,在一个平台上无缝支持传统、虚拟化、云基础架构的集中管理:支持可分布的、可伸缩的体系结构;支持部署在主流的操作系统(Linux)和硬件平台,以及云数据库、云存储、云缓存等云架构上。同时,本方案平台遵循模块化设计,并且任何软件模块的维护和更新都不影响其它软件模块,具有很强的容错能力。
云智慧银行业方案“以数据为基础、以价值为目标、以场景为导向”,提升了IT部门运营的数据洞察力,较大程度上保障银行业务系统的可靠性、业务连续性。
标题:银行业智慧运营中心方案
链接:https://www.ksrongchuan.com/kaiyundianjingdongtai/youxigonglue/1372.html
免责声明:本站资料均来源互联网收集整理,作品版权归作者所有,如果侵犯了您的版权,请发邮件给我们