中國郵政集團
大數據分析平臺

商業挑戰

為了推動業務創新發展,中國郵政集團總公司需要一個優良的解決方案,來強化資料整合與資料分析應用。透過引進 Hadoop 大數據平臺技術,希望達到各式資料互聯互通的目的,打造業界特有的郵政業資料治理體系,為集團的決策支援、產品創新等服務提供更有力的支持。

不過,集團資料量與作業量相當龐大,資料的連通與交換必需有強大的作業排程工具與出色的 ETL 執行效能,才能順利地推動大大小小的開發工作。舊有各業務系統的專業領域與所用技術也大不相同,必須幫助各領域的開發者快速適應新導入的開發環境,降低轉換難度。

預期目標

中國郵政集團有 28 個業務系統的資料需要配合 IT 改革計畫進行資料整合。希望利用 Hadoop 大數據技術與其高資料容量的特性,實現資料倉儲架構,以作為 IT 整合過程中各系統平行轉移、原有應用執行不間斷的重要配套措施。

集團每日高達 5TB 的作業量,與高達 20000+ 的作業排程數,這些作業的執行成效必須滿足載入性能的要求,以及未來每日 10TB 的作業量也須能順暢執行。

解決方案

Trinity 作為強大的資料交換平臺,提供功能強大、易於操作的圖形化介面,可對接中國郵政集團大數據平臺系統中各類傳統資料庫、新型資料及商用 Hadoop 平臺,降低大數據開發的成本與複雜度,幫助集團 IT 架構與大數據平台進行順利的整合。

本案開發過程中,Trinity 的靈活性與高通用性帶給企業更多的正面影響。集團將 Trinity 作為接收外部資料導入和內部資料匯出的便利平台,並逐步替換集團內其他新建專案的資料整合架構,改以 Trinity 取代,形成統一平台交換資料,使集團 IT 工作獲得簡化。

Trinity 提供彈性、多樣的擴展方式,滿足集團的技術架構擴展性要求(支援集群、作業系統無關性、性能線性增加等),使集團的應用開發商可將自己熟悉的 IT 技能擴展至 Trinity,實現特定的功能。

達成效益

藉由 Trinity 的導入,滿足嚴格的作業排程效能與 ETL 資料處理要求,並順利銜接知名廠商的 Hadoop 平台產品,共同為中國郵政集團打造業界領先、高效穩定的大數據分析平臺。

Why Trinity?

  • Trinity 提供批量開發工具,運用批次操作提升作業開發效率。
  • Trinity 資料急速載入的成效優異,使資料交換工作相對節能省時。
  • Trinity 敏捷的排程作業調度能力表現出色,滿足集團數以萬計的作業排程梳理,高效完成作業排程,並最大化提高系統穩定度。
  • 藉由 Trinity 的導入,滿足嚴格的作業排程效能與 ETL 資料處理要求,並順利銜接知名廠商的 Hadoop 平台產品,共同為中國郵政集團打造業界領先、高效穩定的大數據分析平臺。