词云图是根据词出现的频率生成词云,词的字体大小表现了其频率大小。
〇、碎碎念
用wc.generate(text)直接生成词频的方法使用很多,所以不再赘述。
但是对于根据generate_from_frequencies()给定词频如何画词云图的资料找了很久,下面只讲这种方法。
generate_from_frequencies适用于我已知词及其对应的词频是多少,不需要自动生成的情况下。
官方文档说generate_from_frequencies函数的参数是array of tuple,但是我试了很久都不行,最后发现居然应该是dict 字典形式!
即形如:{ word1: fre1, word2: fre2, word3: fre3,......, wordn: fren }
注意词云wordcloud的中文显示,需要特殊处理,在网上看了不少是说加字体路径之类的方法我试了都不行,最后只好采用改变编码的形式才解决好Σ(っ°Д°;)っ:
name[i] = name[i].decode('gb2312')
( • ̀ω•́ )✧还有,示例词云的轮廓背景图由back.jpg给出,如下图:
一、数据文件准备
1、price.csv
name,val
南京,3.19
徐州 ,3.18
淮安,3.16
盐城,3.15
宿迁,3.14
泰州,3.14
扬州,3.13
南通,3.13
连云港 ,3.14
镇江,3.15
无锡,3.14
苏州,3.16
常州,3.17
第一列是城市名,第二列是词频数值,
csv文件本质上就是以逗号(,)分隔开的txt文件,所以用excel打开形式为: