隨着公司業務的發展,各種數據無時不刻地生成,數據量變大已成爲必然的事實。那麼,數據部門要做分析,業務部門要看報表,要跑數據,要用BI,千萬級及以上數據量的分析,性能該如何優化?

要知道,爲了支撐起業務人員的數據分析,以及日常不考慮計算邏輯和技術難度,IT人員也是要花費很大的心血和精力啊,此處心疼運維人員n秒。

對於這種情況,也有很多種方法和優化的點。下面簡單介紹一個完美方案。

現狀分析

當需要從數據庫查詢的表有上萬條記錄的時候,一次性查詢所有結果會變得很慢,特別是隨着數據量的增加特別明顯,查詢時間以數小時甚至數天計,有的分析算法甚至根本無法運行。

我們知道,傳統分析系統採用的批處理方式進行加載和彙總,無法滿足時效性要求。需要分析的數據量越來越多,要彙總的業務也越來越多,留給數據批量加載和彙總的處理時間窗口越來越短,甚至根本無法完成。同時,批量加載方式使得數據的時效性得不到保障,重要的商業機會稍縱即逝。

另外,傳統分析系統都是基於數據概要的統計分析,無法滿足深度挖掘分析要求。然而尚待挖掘的有價值的業務規律,往往隱藏在數據細節中。傳統基於數據概要的分析方法,阻礙了新的業務規律的發現,大大降低了業務數據的分析價值。方案描述

1、系統架構

基於以上背景,億信華辰面向大數據的實時分析平臺應運而生,它採用全新的無共享大規模並行架構(MPP)、真正列式數據庫技術以及超強報表分析引擎,完美解決傳統數據庫和分析系統在實時分析查詢性能慢和擴展性不足等方面的問題。

此平臺具有強大的功能,可迅速、可靠地管理大量數據,提供實時的業務數據以進行先進的大數據分析,從而將所有數據轉變爲效益。在執行查詢方面,實時分析平臺的速度比傳統數據庫快 50 到 1000 倍,同時消耗的成本和佔用的硬件僅是原來的幾分之一。

2、平臺亮點

作爲全新架構的實時分析平臺,有很多的創新,最爲突出特點包括:

a、列式存儲和計算

基於Vertica數據庫,通過列式計算和強大的主動數據壓縮,大幅降低成本高昂的磁盤 I/O(主要是傳統的以行爲存儲單位的 SQL 數據庫使用),執行查詢的速度可提升 50 到 1000 倍,存儲成本最高削減 90%。

b、無共享大規模並行處理 (MPP)

基於Vertica數據庫無共享的 MPP 架構,支持在線添加數量不限的 X86 工業標準服務器,可根據需求任意擴展解決方案。

c、實時秒級分析

通過Vertica內存與磁盤混合存儲架構,支持數據實時裝載分析,再結合億信華辰的豌豆BI敏捷分析引擎以及億信ABI全能分析引擎,實現百億數據秒級實時響應,給用戶帶來極致產品體驗,解決用戶TB甚至PB級超大數據量分析難題。應用效果

1、實現大數據實時分析

面向大數據的實時分析平臺,基於Vertica無共享MPP架構和列式存儲能力,可完美解決用戶大數據量情況下數據實時分析問題,用戶可實時捕捉數據運行情況,如電商運營大屏等,幫助用戶實時決策,運營情況瞭然於胸。

2、實現報表查詢秒級響應

面向大數據的實時分析平臺,對於大數據量的明細數據、彙總數據,都能達到查詢分析秒級響應,幫助各類報表用戶解決報表慢的難題。

3、實現拖拽分析秒級響應

面向大數據的實時分析平臺,滿足業務人員面向百億級明細數據,實現高性能敏捷拖拽分析場景,數據加載後業務人員自助探索體驗可達到秒級響應,提升用戶操作和分析體驗。

以上,Vertica+億信豌豆BI、Vertica+億信ABI的搭配完美解決數據量大、查詢慢、分析慢的困境。至此,作爲公司的科技部門人員,也不擔心業務部門來嚷嚷了。而且速度超快,體驗很棒~

相關文章