利用python实现词频统计
要求
词频统计软件:
- 从文本中读入数据(文件的输入输出)
- 不区分大小写,去除特殊字符。
- 统计单词 例如:about :10 并统计总共多少单词
- 对单词排序(出现次数 )
- 输出词频最高的10个单词和次数
- 把统计结果存入文本
实践
文件的读取,区分大小写,去除特殊字符
1 | import re |
统计,排序
1 | from getfilewords import getword |
结果写入文本
1 | from WordStatistics import statistics |
程序入口
1 | import os |
运行截图
这是需要统计的文本
运行程序
本博客所有文章除特别声明外,均采用 CC BY-NC-SA 4.0 许可协议。转载请注明来自 鱼仔的博客!
评论