怎麼製作詞雲圖(怎麼製作詞雲)

什麼是詞雲?詞雲就是將從一大段文字中按出現頻率提取的關鍵片語織成雲朵或其他的形狀,並在視覺上突出出現頻率較高的關鍵字。

什麼?你說你聽不懂?用簡單的話來說,詞雲就是把一大段文字中的關鍵詞提取出來,做成一張圖,並按照出現的次數多少,決定關鍵詞在結果圖上的大小。

像下圖就是比較常見的雲朵形狀的詞雲:

像下圖就是一個自定義形狀的詞雲:

接下來,小編就教小夥伴們做出一個自定義形狀的詞雲。

Python提供了用於實現詞雲功能的第三方庫wordcloud(直接使用pip命令安裝即可),該庫以文字中詞語出現的頻率作為引數來繪製詞雲,並支援對詞雲的形狀、顏色和大小等屬性進行設定。

利用wordcloud庫生成詞雲一般分為三個步驟:

(1)利用WordCloud類的構造方法WordCloud()建立詞雲物件。

(2)利用WordCloud物件的generate()方法載入詞雲文字。

(3)利用WordCloud物件的to_file()方法生成詞雲。

接下來,按照上面說的三個步驟來生成詞雲。

首先,根據預先準備的字型和圖片建立詞雲物件,因為wordcloud庫中只包含固定的詞雲形狀,若希望生成自定義形狀的詞雲,則需要用到matplotlib.image中的imread()函式,該函式需要接收兩個引數:第一個引數為圖片名,第2個引數為讀取圖片的方式,其值為1時代表讀入彩色影象。建立詞雲物件的程式碼如下:

import wordcloud from matplotlib.image import imread font = 'E://python_study//first_proj//res//AdobeHeitiStd-Regular.otf' # 詞雲形狀 mk = imread('E://python_study//first_proj//res//wukong.png', 1) file.close() # 建立詞雲物件 w = wordcloud.WordCloud(font_path=font, mask=mk, max_words=500,background_color='white')

以上程式碼中讀取的詞雲形狀的原圖是wukong.png,該圖片長這樣:

然後,匯入提前準備好的文字,將文字載入到詞雲物件裡面,程式碼如下:

# 用於生成詞雲的字串 file = open('E://python_study//first_proj//res//西遊記.txt', encoding='utf-8') string = str(file.read()) # 載入文字 w.generate(string)

最後,呼叫to_file()方法生成詞雲,並將生成的詞雲圖片儲存到當前目錄的xiyou.jpg檔案中,程式碼如下:

# 生成詞雲 w.to_file('xiyou.png')

此時開啟程式所在路徑,可觀察到其中生成了詞雲圖片xiyou.png,具體如下圖所示。

通過上面的介紹,小夥伴們有木有覺得生成詞雲的功能特別簡單,想趕緊試一下呢!