您当前的位置: 首页 > 

IT之一小佬

暂无认证

  • 0浏览

    0关注

    1192博文

    0收益

  • 0浏览

    0点赞

    0打赏

    0留言

私信
关注
热门博文

词频统计和词云概述

IT之一小佬 发布时间:2021-03-27 17:32:59 ,浏览量:0

词频统计和词云概述

import jieba
#  分词
word_list = jieba.lcut(chapter.txt[1])
word_list[:10]

import pandas as pd
df = pd.DataFrame(word_list, columns=['word'])
df.head(20)

result = df.groupby(['word']).size()
print(type(result))
freqlist = result.sort_values(ascending=False)
freqlist.head(20)

import nltk
word_list[:10]
fdist = nltk.FreqDist(word_list)  #  生成完整的词条统计词典
fdist

关注
打赏
1665675218
查看更多评论
立即登录/注册

微信扫码登录

0.0382s