中国邮政集团
大数据分析平台

商业挑战

为了推动业务创新发展,中国邮政集团总公司需要一个优良的解决方案,来强化数据资源整合与数据分析应用。透过引进 Hadoop 大数据平台技术,希望达到各式数据互联互通的目的,打造业界特有的邮政业数据治理体系,为集团的决策支援、产品创新等服务提供更有力的支持。

不过,集团数据量与作业量相当庞大,数据的连通与交换必需有强大的作业排程工具与出色的 ETL 执行效能,才能顺利地推动大大小小的开发工作。旧有各业务系统的专业领域与所用技术也大不相同,必须帮助各领域的开发者快速适应新导入的开发环境,降低转换难度。

预期目标

中国邮政集团有 28 个业务系统的数据需要配合 IT 改革计画进行数据整合。希望利用 Hadoop 大数据技术与其高数据容量的特性,实现数据仓库架构,以作为 IT 整合过程中各系统平行转移、原有应用执行不间断的重要配套措施。

集团每日高达 5TB 的作业量,与高达 20000+ 的作业排程数,这些作业的执行成效必须满足载入性能的要求,以及未来每日 10TB 的作业量也须能顺畅执行。

解决方案

Trinity 作为强大的数据交换平台,提供功能强大、易于操作的图形化介面,可对接中国邮政集团大数据平台系统中各类传统数据库、新型数据及商用 Hadoop 平台,降低大数据开发的成本与复杂度,帮助集团 IT 架构与大数据平台进行顺利的整合。

本案开发过程中,Trinity 的灵活性与高通用性带给企业更多的正面影响。集团将 Trinity 作为接收外部数据导入和内部数据导出的便利平台,并逐步替换集团内其他新建项目的数据整合架构,改以 Trinity 取代,形成统一平台交换数据,使集团 IT 工作获得简化。

Trinity 提供弹性、多样的扩展方式,满足集团的技术架构扩展性要求(支援集群、作业系统无关性、性能线性增加等),使集团的应用开发商可将自己熟悉的IT 技能扩展至Trinity,实现特定的功能。

达成效益

藉由 Trinity 的导入,满足严格的作业排程效能与 ETL 数据处理要求,并顺利衔接知名厂商的 Hadoop 平台产品,共同为中国邮政集团打造业界领先、高效稳定的大数据分析平台。

Why Trinity?

  • Trinity 提供批量开发工具,运用批次操作提升作业开发效率。
  • Trinity 数据急速载入的成效优异,使数据交换工作相对节能省时。
  • Trinity 敏捷的排程作业调度能力表现出色,满足集团数以万计的作业排程梳理,高效完成作业排程,并最大化提高系统稳定度。
  • 藉由 Trinity 的导入,满足严格的作业排程效能与 ETL 数据处理要求,并顺利衔接知名厂商的 Hadoop 平台产品,共同为中国邮政集团打造业界领先、高效稳定的大数据分析平台。