电信行业ODS-D系统IO瓶颈解决方案

客户概述

中国电信广东公司是中国电信集团公司最大的省级分公司,中国电信广东公司经营范围:广东省内的国内固定电信网络与设施(含 本地无线环路)业务、移动通信业务;基于固定电信网络和移动通信网络的话音、数据、图像及多媒体通信与信息服务;按国家规定进 行国际电信业务对外结算,开拓国际通信市场;电子、通信技术服务、信息咨询;通信设备销售。经营与通讯及信息业务相关的系统 集成、技术开发、技术服务、信息咨询、广告、设备生产销售和进出口、设计施工等业务。目前主要经营品牌及业务 :商务领航、我 的e家、号码百事通、天翼互联网手机、信息田园、经典固话、电信宽带、全球眼、互联星空等作为综合信息服务提供商。

客户需求

ODS-D系统是广东电信运营数据分析决策的平台,其使用的数据库是Oracle 11.2.0.4(Linux x86-64平台),通过Oracle GoldenGate(下面简称“OGG”)工具将生产系统(CRM、计费、服务开通、资源管理及客服等)的数据实时同步到ODS-D系统, 目前数据同步效率低,导致部分ODS-D系统业务数据与生产系统数据差异在十小时以上,严重影响了客户业务决策分析。客户希望 缩短差异数据的时间,提高业务决策分析的精度。

客户应用遇到的问题分析

经分析OGG同步处理日志发现,OGG target端replicate进程在将远端生产系统产生的业务变更trail文件分析成SQL语句后,处 理本地入库更新时效率低下。进一步采集入库更新时Oracle数据库的实时负载信息,发现更新效率低的根本原因是底层存储设备性能 不足。经核实底层数据库文件存放在由10块SAS HDD组成的RAID10磁盘阵列上,由于业务写入压力大,该磁盘阵列IO能力不能满 足业务需求,导致业务数据同步慢,部分业务数据延迟达到14个小时。

解决方案分析

系统概述

经过与客户交流测试,用具有超低延迟与超高性能的Shannon Direct-IO™ PCIe Flash-G2i设备替换原有RAID10磁盘阵列,从 而满足上层数据库应用的需求。

改造前后架构图
改造前后系统IO性能对比

系统改造完成后,用户对ODS-D系统数据库的IO性能进行了对比,结果如下:

ogg同步进程同步数据时延对比

总结

通过采用Shannon Direct-IO™ PCIe Flash 存储设备替代之前RAID10磁盘阵列,消除了原有系统的IO性能瓶颈,整个系统数据 实时写入性能提升15倍。设备上线需要停机,造成OGG产生的trail数据文件积压一天,系统重新上线后半个小时同步完毕,后续增量 数据实时同步。

Shannon Direct-IO™ PCIe Flash的成功应用提升了业务系统的整体性能,这种优化改造无需重新设计系统架构和方案,只需简 单安装Shannon Direct-IO™ PCIe Flash设备并将数据迁移到其上即可,其可以作为电信业务系统优化改造的优选方案。