在hadoop平台上,用mapreduce编程完成大数据的词频统计
2022/12/12 6:03:13 5KB 大数据 hadoop mapreduce
1
次要是读取文本,然后进行分词、词干提取、去停用词、计算词频,有界面,很实用
2017/4/26 5:41:42 70KB 词频计算
1
利用python编写了完整爬虫代码,用于爬取百度搜索旧事,输入任意关键词可以爬取相关旧事,对爬取的旧事进行词频统计,分词处理后自动生成旧事摘要。
附有完整爬虫、摘要生成及分词处理代码,另有使用说明备注。
2019/9/24 4:33:35 73KB python爬虫 网络爬虫 百度新闻 NLP
1
使用Python,对爬取微博的评论,进行jieba分词,统计词频,修正路径即可。
2015/4/27 23:42:27 835B jieba 分词 微博评论
1
ROST 内容挖掘零碎使用手册功能性分析:分词、字频分析、英文词频分析(文件词频统计、剪切板词频统计 、查看统计表格 、查看大纲列表 、描红超纲词、查看非词表、加密词表、打开词典目录);
文本操作;
可视化;
工具;
聊天分析;
全网分析;
网站分析;
浏览分析;
微博分析;
期刊分析
2018/11/12 7:12:25 756KB ROST
1
此案例运用的是IDEA开发工具,项目属于maven项目该词频统计案例中,数据源是自动产生的(java程序自定义生成的),针对自定义生成的数据完成词频统计,完成后打包上传到storm程序中执行
2019/4/6 8:53:10 4.72MB storm 源码软件 java 大数据
1
在日常工作中,钉钉打卡成了我生活中不可或缺的一部分。然而,有时候这个看似简单的任务却给我带来了不少烦恼。 每天早晚,我总是得牢记打开钉钉应用,点击"工作台",再找到"考勤打卡"进行签到。有时候因为工作忙碌,会忘记打卡,导致考勤异常,影响当月的工作评价。而且,由于我使用的是苹果手机,有时候系统更新后,钉钉的某些功能会出现异常,使得打卡变得更加麻烦。 另外,我的家人使用的是安卓手机,他们也经常抱怨钉钉打卡的繁琐。尤其是对于那些不太熟悉手机操作的长辈来说,每次打卡都是一次挑战。他们总是担心自己会操作失误,导致打卡失败。 为了解决这些烦恼,我开始思考是否可以通过编写一个全自动化脚本来实现钉钉打卡。经过一段时间的摸索和学习,我终于成功编写出了一个适用于苹果和安卓系统的钉钉打卡脚本。
2024-04-09 15:03 15KB 钉钉 钉钉打卡