如何把竖排的数据变为横排_实例46_Python文本数据可视化之“词云”图

如果要将实例45做好的词频分析可视化,“词云图”是一个很好的选择。它的原理是,将词频高的词显示得相对更大一些。而且可以自定义背景图,让词云显示成个性化的形状。

今天我们就来将实例45获取的10家上市公司的“主要业务”词频文件批量生成词云图,这样一看词云图就大致了解这家公司的主要业务是什么了,放在PPT里展示也显得高大上。首先,我们导入需要用到库。若显示导入不成功,则需要用pip install + 库名进行安装。

import numpy as np # numpy数据处理库
import wordcloud # 词云库
from PIL import Image # 图像处理库,用于读取背景图片
import matplotlib.pyplot as plt # 图像展示库,以便在notebook中显示图片
from openpyxl import load_workbook #读取词频Excel文件
import os #获取词频Excel文件路径

然后获取所有的Excel词频表路径,以便后续逐一读取,并传入词云库生成词云图。再定义词频背景图,np.array(Image.open())打开图片后转为数组,存入maskImage变量。需要注意词频背景图中想要的形状的背景需要是白色的,不然无法得到想要的词云图形状。

比如如下背景图片,左边的图片因为猴子的背景不是白色,做出的词云图会占满整个图片,即是一个矩形的词云图;右边的图片中,猴子的背景是白色的,做出的词云图看起来就是一只猴子的形状。

如何把竖排的数据变为横排_实例46_Python文本数据可视化之“词云”图_第1张图片

然后用for循环遍历所有待处理的Excel文件,逐个打开,提取其中的词和词频,存入字典wordFreq。然后通过wordcloud.WordCloud()定义词云样式。这个函数有很多参数,具体如下。我们只

你可能感兴趣的:(如何把竖排的数据变为横排)