博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
运用jieba库分词
阅读量:6503 次
发布时间:2019-06-24

本文共 816 字,大约阅读时间需要 2 分钟。

代码:

统计出团队中文简介中词频

import jieba

txt=open("C:\\Users\\Administrator\\Desktop\\介绍.txt","r",encoding='utf-8').read()

words=jieba.lcut(txt)

counts={}

for word in words:

    if len(word)==1:

        continue

    else:

        counts[word]=counts.get(word,0)+1

items=list(counts.items())

items.sort(key=lambda x:x[1],reverse=True)

for i in range(5):

    word,count=items[i]

print("{0:<10}{1:>5}".format(word,count))

画出词频分布图:

import numpy as np

import matplotlib.pyplot as plt

fracs = [5,4,4,4,4]

labels = 'xiwang', 'daima', 'biancheng','meiyou','xingqu'

explode = [ 0.1,0,0,0,0]

plt.axes(aspect=1)

plt.pie(x=fracs, labels=labels, explode=explode,autopct='%3.1f %%',

        shadow=True, labeldistance=1.1, startangle = 90,pctdistance = 0.6)

plt.show()

简介用词特点:能体现队员的特点,让大家更加充分了解每一个队员的兴趣,能力,以及想要负责的工作,更好地为团队做出贡献。

转载于:https://www.cnblogs.com/light1/p/8784765.html

你可能感兴趣的文章
1.电子商务支付方式有哪些 2.比较不同支付方式的优势劣势
查看>>
医疗卫生系统被爆漏洞,7亿公民信息泄露……
查看>>
神秘函件引发的4G+与全网通的较量
查看>>
Windows下与Linux下编写socket程序的区别
查看>>
CloudCC:智能CRM究竟能否成为下一个行业风口?
查看>>
高德开放平台推出LBS游戏行业解决方案提供专业地图平台能力支持
查看>>
追求绿色数据中心
查看>>
Web开发初学指南
查看>>
OpenStack Days China:华云数据CTO郑军分享OpenStack创新实践
查看>>
探寻光存储没落的真正原因
查看>>
高通64位ARMv8系列服务器芯片商标命名:Centriq
查看>>
中国人工智能学会通讯——融合经济学原理的个性化推荐 1.1 互联网经济系统的基本问题...
查看>>
盘点大数据商业智能的十大戒律
查看>>
戴尔为保护数据安全 推出新款服务器PowerEdge T30
查看>>
今年以来硅晶圆涨幅约达40%
查看>>
构建智能的新一代网络——专访Mellanox市场部副总裁 Gilad Shainer
查看>>
《数字视频和高清:算法和接口》一导读
查看>>
《中国人工智能学会通讯》——6.6 实体消歧技术研究
查看>>
如何在Windows查看端口占用情况及查杀进程
查看>>
一分钟秒懂公有云、私有云、混合云......
查看>>