摘要:就拿現在市面上比較常見的powerBI、FineBI、tableau這些BI工具來說,你會發現它是完全按照數據分析的流程來設計的,先是數據處理、整理清洗,再到數據建模,最後數據可視化,展現圖表,用圖來講故事,發掘問題影響決策。如果說BI工具是戰鬥機,R語言、Python是轟炸機,那麼Excel就是數據分析裏的航空母艦,表格製作、數據透視表、VBA等等功能強大,Excel的體系龐大到沒有任何一個分析工具能夠超過它,保證人們能夠按照需求進行分析。

提及數據分析工具相信小夥伴們都不陌生,但是很多人都會有個疑惑?

數據分析工具這麼多,它們有什麼區別?哪個更好?哪個更強?我應該學習哪個?

雖然這個問題有點俗套,但是很重要,我也一直努力在追求這個終極問題的答案。如果大家在網上去搜索這方面相關的信息,你又很難看到一個公平的觀點。因爲評價某一個工具的好壞評論者都可能站在不同的角度,帶上一些個人的感情色彩。

今天我們拋開這些個人色彩的東西,力求客觀地與大家淺談一下我個人對市面上幾款數據分析工具的看法,供大家參考。

我共選了三類工具:

Excel

BI工具

R、Python等編程類語言

下面我一一來介紹:Excel

如果說BI工具是戰鬥機,R語言、Python是轟炸機,那麼Excel就是數據分析裏的航空母艦,表格製作、數據透視表、VBA等等功能強大,Excel的體系龐大到沒有任何一個分析工具能夠超過它,保證人們能夠按照需求進行分析。

當然也有人認爲自己非常精通計算機編程語言,不屑於使用Excel這種工具,因爲Excel不能處理大數據。但換個思維想想,我們在日常中用到的數據是否超過了大數據這個極限呢?在我看來,Excel屬於萬能型的選手,解決小數據當然最適合,加上插件也可以處理百萬級的數據。

總結一下,基於Excel的強大的功能和它的用戶規模,我的看法是,它是必備工具,你要是想學數據分析Excel絕對是首選,而且是必選!BI工具

BI也就是商業智能,這是爲了數據分析而生的,它誕生的起點就非常高,目標是把從業務數據到經營決策的時間縮短,如何利用數據來影響決策。

而我們看Excel的產品目標不是這樣的,Excel可以做很多事情,你用Excel可以畫一張課程表,做一份調查問卷,當作計算器來算數,甚至還可以用來畫畫,用VBA寫個小遊戲,這些其實都不是數據分析功能。

但是術業有專攻,BI是專攻數據分析的。

就拿現在市面上比較常見的powerBI、FineBI、tableau這些BI工具來說,你會發現它是完全按照數據分析的流程來設計的,先是數據處理、整理清洗,再到數據建模,最後數據可視化,展現圖表,用圖來講故事,發掘問題影響決策。

這些是數據分析的必經之路,同時這個流程裏面也存在着從業者的一些痛點:

比如清洗數據這種重複性、低附加值的工作,可以用BI工具簡單化;

做數據透視分析,由於數據量很大,傳統Excel工具就很喫力,卡掉、死機;

做圖形展現,用Excel可能會花費很多時間編輯圖表,包括顏色、字體的設定;

這些痛點都是BI工具能夠給我們帶來改變和增值的地方。

那麼再來談談PowerBI、FineBI、Tableau等BI工具之間的對比:

1、Tableau:

Tableau的核心本質其實就是excel的數據透視表和數據透視圖,可以說它敏銳地發覺了Excel的這個數據透視特性,較早地切入了BI市場,把這個核心價值發揚光大了。

從發展歷史和當前的市場的反饋情況看,Tablueau在可視化方面更勝一籌。這個優勢我認爲並不是圖表有多炫酷,而是它的設計、色彩、操作界面給人一種簡單,清新的感覺。這一點的確是像Tableau自己所宣傳的,投入了很多學術性精力研究人們喜歡什麼樣的圖表,怎樣在操作和視覺上給使用者帶來極致的體驗。

此外,Tableau也在日趨完善,比如加入數據清洗功能和更多智能分析功能。這也都是Tableau可預計的產品發展優勢。

2、Power BI

power bi勝在微軟的商業模式和產品的數據分析功能:

PowerBI之前是以Excel插件作爲產品,受限於Excel本身這個航母,發展情況並不理想,於是從Excel的插件中剝離出來,獨立成一門派,脫胎換骨。但作爲後來者,每個月都有迭代跟新,追趕速度非常快。

powerBI的商業模式是軟件免費,這樣你不用擔心盜版、破解版的問題,因爲正版都是免費的,這一點相比Tableau的動輒幾千元的售價實在是很有誘惑力;另一方面是數據分析功能,就是PowerPivot,DAX語言,它可以讓我用類似Excel寫公式的方式,實現很多非常複雜的高級分析。

3、Fine BI

再說Fine BI,它的獨到之處就在於自助式BI更適合企業級用戶。

比如取數,業務人員一會一個需求,這裏數據不對、那裏報表格式不對,效率很低。像有些企業是沒有數據分析師這樣的崗位,FineBI的自助化就能夠實現在權限內自己取數分析,不再讓業務和IT互相扯皮。

傳統的BI方式可能會需要ETL架構師或者是數據建模師等,但是自助式BI所需要的就很少了,基本上是可以完成人工的解放,儘可能地去減少成本。

還有一個比較重要的點是,FineBI是通過拖拽字段的方式,實現數據透視分析的,可以一鍵生成圖表,入門門檻比較低,對於數據分析新手來說,比powerBI和tableau要好學一點。

R語言和python

第三類工具,這是最難的回答的。雖然像Excel,Bi工具這些軟件的設計已經盡最大努力考慮到大部分數據分析的應用場景,但本質上他們都是定製化的,如果沒有設計某一項功能,或者開發某項功能的按鈕,很有可能你就不能完成你的工作。

對於這一點,編程語言就不一樣了,語言是非常強大非常靈活的,你可以隨心所欲地寫代碼執行你想要的東西。比如R和Python語言,作爲數據科學家的必備工具,從職業高度上講,這絕對是高於Excel、BI工具的。

那麼有哪些應用場景,R、Python 可以做,而Excel和BI工具比較難實現呢?

1、專業的統計分析

以R語言來講,它最擅長的是統計型分析,比如求正態分佈,利用算法歸類聚羣,迴歸分析等。這種分析就好比把數據當做一種實驗品,它能夠幫助我們回答的問題:

比如數據的分佈情況,是正態分佈、三角分佈還是其他類型的分佈?離散情況如何?是否在我們想要達到的統計可控範圍內呢?不同參數對結果的影響的量級是多少?以及假設性模擬分析,如果某一參數變化,會帶來多大的影響?

2、個體預測分析

比如我們想要預測一位消費者的行爲,他會在我們的店裏停留多長時間,消費多少,或者通過一個人的淘寶消費記錄判斷他的個人信用情況,制定貸款額度;再或者根據你在網頁上的瀏覽記錄,推送不同的商品。這也是涉及到目前比較火的機器學習、人工智能概念。

總結

以上的對比說明了幾個軟件的差別,我想總結的是,存在即合理。Excel\BI\編程語言,這些工具在應用上有交叉重疊的地方,也有互補的地方。對於重疊的地方,無論是哪種工具,只要你能利用它解決你遇到的問題,它就是最棒的。

選擇哪個工具,首先要了解你自己的工作,是否會用到我剛纔提到的那些應用場景。或者想想你的從業方向,是朝着偏重數據的數據科學方向發展,還是偏業務的商業分析方向。

相關文章