預祝全國考生:鯉魚躍龍門,門門考高分~

stylecloud基於wordcloud庫,使用方法更簡單一些。該庫的特點有

  • 支持詞雲圖圖標形狀設置

  • 可直接讀取csv文件(csv有兩列,word和freq)

  • 可調色

  • ...

安裝

pip install stylecloud

數據

csv爲詞頻統計結果,兩個字段,分別爲 word和freq

今天準備了兩個csv

  • data/高考.csv

  • data/股市.csv

import pandas as pd

df1 = pd.read_csv('data/高考.csv')
df1.head()
word freq
0 高考 2198
1 未來 1549
2 決定 1443
3 一個 806
4 可以 644
df2 = pd.read_csv('data/股市.csv')
df2.head()
word freq
0 牛市 1993
1 圖片 649
2 市場 530
3 A股 527
4 股市 520

快速上手

import stylecloud

stopwords = open('data/stopwords.txt', encoding='utf-8').read().split('\n')

stylecloud.gen_stylecloud(file_path='data/高考.csv',
                          font_path='data/SourceHanSansCN-Regular.otf',
                          output_name='output/高考1.png',
                          size=500,
                          custom_stopwords=stopwords)

import stylecloud
stopwords = open('data/stopwords.txt', encoding='utf-8').read().split('\n')

stylecloud.gen_stylecloud(file_path='data/股市.csv',
                          font_path='data/SourceHanSansCN-Regular.otf',
                          output_name='output/股市1.png',
                          size=500,
                          custom_stopwords=stopwords)

stylecloud參數介紹

  • file_path:CSV的文件路徑,需要注意的是csv文件格式爲兩列(word, freq)

  • size:詞雲圖尺寸[默認值:512]

  • custom_stopwords:自定義停用詞列表

  • output_name:輸出的詞雲圖路徑

  • font_path:字體路徑

  • icon_name:圖標名(fas fa-iconname)只需要改iconname,[默認值: fas fa-flag]

  • palette:調色板(通過 palettable 實現)[默認值:cartocolors.qualitative.Bold_6]

  • background_color:詞雲圖背景色[默認值:white]

  • max_font_size:詞雲圖最大字號[默認值:200]

  • random_state:控制單詞和顏色的隨機狀態,如不設置,每次運行的效果會發生變化

圖形設置

icon_name參數的模板【fas fa-iconname】只需要改動iconname即可。

iconname並不是隨便起的,必須能在https://fontawesome.com/license/free 搜到纔可以。

比如以 高考 爲例,我會在搜索框搜索跟 教育 相關的關鍵詞

  • university

  • education 等

截圖中找到最能體現文本主題的圖標 user-graduate

所以icon_name = 'fas fa-user-graduate'

import stylecloud
stopwords = open('data/stopwords.txt', encoding='utf-8').read().split('\n')

stylecloud.gen_stylecloud(file_path='data/高考.csv',
                          font_path='data/SourceHanSansCN-Regular.otf',
                          output_name='output/高考2.png',
                          icon_name='fas fa-user-graduate',
                          size=500,
                          custom_stopwords=stopwords)

import stylecloud
stopwords = open('data/stopwords.txt', encoding='utf-8').read().split('\n')

stylecloud.gen_stylecloud(file_path='data/股市.csv',
                          font_path='data/SourceHanSansCN-Regular.otf',
                          output_name='output/股市2.png',
                          icon_name='fas fa-question-circle',
                          size=500,
                          custom_stopwords=stopwords)

往期文章

小案例: Pandas的apply方法 

用Python繪製近20年地方財政收入變遷史視頻

Python語法快速入門

Python網絡爬蟲與文本數據分析

讀完本文你就瞭解什麼是文本分析

文本分析在經管領域中的應用概述

綜述:文本分析在市場營銷研究中的應用

從記者的Twitter關注看他們稿件的黨派傾向?

Pandas時間序列數據操作

70G上市公司定期報告數據集

文本數據清洗之正則表達式

shreport庫: 批量下載上海證券交易所上市公司年報

Numpy和Pandas性能改善的方法和技巧

漂亮~pandas可以無縫銜接Bokeh

YelpDaset: 酒店管理類數據集10+G

公衆號後臺回覆關鍵詞【stylecloud】即可下載本文數據代碼

分享 ”和“ 在看 ”是更好的支持!

相關文章