作者:刘邵博此词典为个人综合多本词典整合的一个大词典,词典共有词汇3669216个词汇。
词典结构为:词语\t词性\t词频。
词频是用ansj分词对270G新闻语料进行分词统计词频获得。
部分词汇无法确定是什么词性,对词性进行特别标注:nw和comb1、词性nw表示本身不知道是什么词性。
2、词性comb表示通过ansj的nlp分词之后又被拆成了两个词。
2025/3/27 20:28:52 20.77MB NLP
1
WPS2012版本一下适用,词频分析插件
2025/2/14 2:05:57 2.6MB 词频
1
给定微博id和爬取评论数量,爬取对应微博的评论,便于下一步的分词和词频统计
2025/1/21 18:20:14 3KB 爬虫 代码 微博评论
1
ROST中文词频统计,比较方便的切词,统计词频。
完全免费
2024/11/1 21:51:50 1.19MB 中文 ,词频
1
python编程语言预处理统计词频计算IT-IDF
2024/10/31 6:51:43 6KB python IF DF
1
主要是读取文本,然后进行分词、词干提取、去停用词、计算词频,有界面,很实用
2024/10/6 4:02:25 71KB 分词 去停用词 词频计算
1
1:中文分词2:词频统计3:罗列出要自动提取的关键字----------------------------------------具有60万字/秒的高速处理能力。
2024/8/29 7:46:11 2.6MB 中文分词 关键字提取
1
搜狗的词库带词语词性词频自然语言处理之必备良药
2024/7/24 9:01:05 1.11MB 词库 自然语言处理
1
Python练习项目目标编写Python微博爬虫数据来源微博列表请求分析应答报文分析获取微博正文微博正文文本提取获取多页微博反爬虫机制应对处理爬虫完整代码词云图生成成果展示目标用爬虫程序抓取目标用户人民日报的微博文本,通过分析词频,生成直观的词云图。
编写Python微博爬虫注意:微博的接口可能会发生变化,所以请不要盲目照抄,建议按照下述流程独立分析。
数据来源微博移动版网页(点此跳转)内容简洁,便于分析,因此选用移动版网页作为爬取对象。
微博列表请求分析打开目标用户的移动版微博主页:人民日报注意:此处需要退出微博登录来保证请求内容的普适性。
F12打开开发者工具,这里使用的是谷
2024/7/16 20:52:29 218KB python python爬虫 爬虫
1
使用C++标准库中的MAP容器实现词频统计与排序
1
共 58 条记录 首页 上一页 下一页 尾页
在日常工作中,钉钉打卡成了我生活中不可或缺的一部分。然而,有时候这个看似简单的任务却给我带来了不少烦恼。 每天早晚,我总是得牢记打开钉钉应用,点击"工作台",再找到"考勤打卡"进行签到。有时候因为工作忙碌,会忘记打卡,导致考勤异常,影响当月的工作评价。而且,由于我使用的是苹果手机,有时候系统更新后,钉钉的某些功能会出现异常,使得打卡变得更加麻烦。 另外,我的家人使用的是安卓手机,他们也经常抱怨钉钉打卡的繁琐。尤其是对于那些不太熟悉手机操作的长辈来说,每次打卡都是一次挑战。他们总是担心自己会操作失误,导致打卡失败。 为了解决这些烦恼,我开始思考是否可以通过编写一个全自动化脚本来实现钉钉打卡。经过一段时间的摸索和学习,我终于成功编写出了一个适用于苹果和安卓系统的钉钉打卡脚本。
2024-04-09 15:03 15KB 钉钉 钉钉打卡