歡迎光臨
每天分享高質量文章

Python資料視覺化詞雲展示周董的歌

馬上開始了,你準備好了麼

準備工作

環境:Windows + Python3.6
IDE:根據個人喜好,自行選擇
模組:
Matplotlib是一個 Python 的 2D數學繪相簿

pip install matplotlib
import matplotlib.pyplot as plt

jieba中文分詞庫

pip install jieba
import jieba

wordcloud詞雲庫

pip install wordcloud
from wordcloud import WordCloud

實戰具體步驟:

1、讀入txt文字資料。
2、結巴中文分詞,生成字串預設精確樣式,如果不透過分詞,無法直接生成正確的中文詞雲。
3、生成詞雲圖,這裡需要註意的是WordCloud預設不支援中文,所以這裡需已下載好的中文字型檔。
(無自定義背景圖:需要指定生成詞雲圖的畫素大小,預設背景顏色為黑色,統一文字顏色:mode=’RGBA’和colormap=’pink’)
4、顯示圖片。

總體而言只有四個步驟還是比較簡單的那咱們先看一下實現的效果圖吧!

看到效果圖後發現裡面的秘密沒?

完整程式碼

# Matplotlib是一個 Python 的 2D數學繪相簿
# 安裝:pip install matplotlib
import matplotlib.pyplot as plt
# jieba中文分詞庫
# 安裝:pip install jieba
import jieba
# wordcloud詞雲庫
# 安裝pip install wordcloud
from wordcloud import WordCloud
# 1.讀入txt文字資料
text = open(r'.\jay.txt', "r").read()
#print(text)
# 2.結巴中文分詞,生成字串,預設精確樣式,如果不透過分詞,無法直接生成正確的中文詞雲
cut_text = jieba.cut(text)
# print(type(cut_text))
# print(next(cut_text))
# print(next(cut_text))
# print(next(cut_text))
# 必須給個符號分隔開分詞結果來形成字串,否則不能繪製詞雲
result = " ".join(cut_text)
#print(result)
# 3.生成詞雲圖,這裡需要註意的是WordCloud預設不支援中文,所以這裡需已下載好的中文字型檔
# 無自定義背景圖:需要指定生成詞雲圖的畫素大小,預設背景顏色為黑色,統一文字顏色:mode='RGBA'和colormap='pink'
wc = WordCloud(
       # 設定字型,不指定就會出現亂碼
       font_path=r'.\simhei.ttf',
       # 設定背景色
       background_color='white',
       # 設定背景寬
       width=500,
       # 設定背景高
       height=350,
       # 最大字型
       max_font_size=50,
       # 最小字型
       min_font_size=10,
              )  # max_words=1000 ),mode='RGBA',colormap='pink')
# 產生詞雲
wc.generate(result)
# 儲存圖片
wc.to_file(r".\wordcloud.png")  # 按照設定的畫素寬高度儲存繪製好的詞雲圖,比下麵程式顯示更清晰
# 4.顯示圖片
# 指定所繪圖名稱
plt.figure("jay")
# 以圖片的形式顯示詞雲
plt.imshow(wc)
# 關閉影象坐標系
plt.axis("off")
plt.show()

溫馨提示

如果你喜歡本文,請分享到朋友圈,想要獲得更多資訊,請關註我。

贊(0)

分享創造快樂