摘要:做詞雲的核心步驟只有兩個——輸入文本和呼喚詞雲包。經常做數據分析的人肯定不會對詞雲圖感到陌生,尤其是近幾年來非常流行,不管是發佈會、行業報告還是新聞,都喜歡使用詞雲這種形式,將信息的關鍵詞組成形象生動的圖案,一下子就能抓住生人眼球,因爲詞雲圖這種可視化圖表給人的第一印象就是足夠裝逼,足夠亮眼。

經常做數據分析的人肯定不會對詞雲圖感到陌生,尤其是近幾年來非常流行,不管是發佈會、行業報告還是新聞,都喜歡使用詞雲這種形式,將信息的關鍵詞組成形象生動的圖案,一下子就能抓住生人眼球,因爲詞雲圖這種可視化圖表給人的第一印象就是足夠裝逼,足夠亮眼!

三個方法教你做詞雲圖,連文科生都能輕鬆學會

羅振宇的跨年演講中用到詞雲

但是詞語云圖的最大優點,其實並不是它的顏值,而是它能夠能夠直觀地展示數據頻率,對出現頻率較高的關鍵詞予以重點突出,從而過濾掉大量的文本信息,幫助我們進行數據分析。

而且,如果能夠親手做一個詞雲圖,發到朋友圈裏豈不是能夠帥到沒朋友?

網上有很多線上詞雲製作網站,但是基本上很難實現對數據的篩選和過濾,僅僅是有着好看的皮囊而已。對於數據分析人而言,還是要藉助專業的分析工具,下面我就用Python和FineBI這兩個常用的數據分析工具,分別實操一下如何製作炫酷又裝逼的詞雲。

Pyhton

1、安裝Python運行環境和套裝

這個不必多說,推薦下載的套裝是anaconda,做詞雲很好用。下載完畢後,配置好運營環境後,執行安裝文件就行了。

三個方法教你做詞雲圖,連文科生都能輕鬆學會

2、準備數據

下面是我隨便找了一篇英文文章,作爲要進行詞雲製作的數據基礎:

三個方法教你做詞雲圖,連文科生都能輕鬆學會

我把其中的正文文字部分拷貝了下來,存儲爲一個文本文件,叫做yes-minister.txt,把這個文件挪動到我們的工作目錄demo裏,這樣數據就準備好了。

3、開始做詞雲了

做詞雲的核心步驟只有兩個——輸入文本和呼喚詞雲包。

首先,在命令行下,輸入:

jupyter notebook

瀏覽器會自動開啓,並且顯示如下界面——Jupyter的主頁面,我們點擊New按鈕,選擇Python 2選項。

三個方法教你做詞雲圖,連文科生都能輕鬆學會

然後就出現了一個空白的筆記本,供我們使用了。我們在網頁裏唯一的代碼文本框裏,輸入以下3條語句,輸入後,按Shift+Enter鍵,就可以執行了。

filename = "yes-minister.txt"with open(filename) as f: mytext = f.read()

顯示的結果如下圖所示。

三個方法教你做詞雲圖,連文科生都能輕鬆學會

文本就出現了,然後我們呼喚(import)詞雲包,利用mytext中存儲的文本內容來製造詞雲。

from wordcloud import WordCloudwordcloud = WordCloud().generate(mytext)

此時,製作詞雲最核心的兩步就完成了。

4、調出詞雲,完成

輸入下面4行語句:

%pylab inlineimport matplotlib.pyplot as pltplt.imshow(wordcloud, interpolation='bilinear')plt.axis("off")

運行結果如圖所示:

三個方法教你做詞雲圖,連文科生都能輕鬆學會

這樣一個簡單的詞雲圖就做好了,想要將詞雲圖做的更加美觀,還需要調節各種參數,這裏就不一一講解了,感興趣地可以自己慢慢去探索。

FineBI

相比於Python,用FineBI最大的好處就是不用編寫代碼,簡單易用,毫無數據和編程基礎的人都能夠輕鬆做出好看的詞雲。

1、下載安裝FineBI,準備數據

下載地址可以私聊我“FineBI”獲得免費下載鏈接,爲了方便起見,我這裏就直接用FineBI自帶的數據了。

三個方法教你做詞雲圖,連文科生都能輕鬆學會

2、組件設置

新建組件並選擇樣式數據業務包下的搜索詞彙統計表,將待分析區域維度下的字段“搜索詞”拖入橫軸中,將指標下的字段“搜索次數”拖入縱軸中,在圖表類型下選擇詞雲圖。

三個方法教你做詞雲圖,連文科生都能輕鬆學會

3、大小、文本、顏色的優化

選擇該圖表類型後,圖形屬性下形狀自動切換爲文字,維度字段被添加到文本中,指標字段添加到大小屬性中,如下圖:

三個方法教你做詞雲圖,連文科生都能輕鬆學會

4、詞雲完成

三個方法教你做詞雲圖,連文科生都能輕鬆學會

總結

通過進行詞雲分析,我們可以看的出來哪些數據是出現頻次最多的,我們的關注點是哪些。這次我演示做的詞雲也很簡單,後續在研究研究讓它更美觀一些,精準一些。

下載地址可以私聊我“FineBI”,獲得免費版下載鏈接!

相關文章