基于C++编写的中文分词程序,内有完整的代码,且有小词库,解压即可运行
2024/12/8 20:52:11 28KB 分词
1
jieba分词所需要使用的jar包结巴分词的使用比较方便,效果也不错,也无需连接网络即可使用。
在项目中使用到了结巴分词,故在此保存备份。
2024/12/1 12:50:49 2.09MB jieba分词jar包
1
该资源收集了1900多个停用词,在分词系统中使用非常广泛,该资源将会不定期更新,欢迎下载和提出疑问!
1
基于语义检索的目的,结合成语典故本体的构建,设计了一个基于成语典故本体的语义检索模型,阐述了检索模型中用户界面模块、数据存储模块、查询分析模块和检索分析模块的功能;
分析了系统中的本体构建技术、分词技术及检索技术,设计并实现了词语相似度及概念相似度算法;
通过语义检索系统的实验,得到较高的查全率和查准率。
1
solr集成IK分词,动态扩展词及停用词实现,动态添加到solr词库中,无需重建solr索引,更无需重启solr服务啦
2024/11/4 15:29:31 9.24MB solr ik分词 词库管理 ik-analyzer-8.3
1
ROST-CM6软件,很好用的分词与网络分析软件。
2024/10/22 16:56:57 8.61MB ROST-CM6软件
1
中文词表,可用于分词,共53143个词条
2024/10/22 9:41:17 641KB 中文词表
1
第一阶段:这一阶段会学习MapReduce、Hive、HDFS、Yarn、Spark等计算框架的开发技术,以及Scala编程语言。
通过项目实践,你能快速掌握这些技术,获得数据开发、数据挖掘、机器学习等职位必备的基本开发能力。
第二阶段:这一阶段会学习FLume、Kafka、SparkStreaming、Flink/Storm、Zookeeper、HBase等计算框架的开发技术,以及大数据体系内的数据采集和数据仓库理论思想和技术实现。
通过项目实践,你能快速掌握这些技术,获得完整的大数据架构开发能力。
第三阶段:这一阶段会学习NLP文本相似度、中文分词、HMM算法、推荐算法CF、回归算法等应用与开发技术,整体认识商业项目-音乐推荐系统。
使用海量真实数据对大数据平台和算法进行应用实践,快速掌握大数据行业具有巨大价值的核心技术。
第四阶段:这一阶段会学习分类算法、聚类算法、分类算法-决策树、分类算法-SVM、神经网络+深度学习,深化前3阶段技术能力,初入机器学习领域。
通过对机器学习核心算法的强化练习,你将能完美胜任目前人才最紧缺的数据挖掘开发职位。
2024/10/13 15:34:27 128B 大数据 机器学习 数据挖掘
1
电商网站上热水器产品评论分析:1.某一品牌热水器的用户情感倾向2.某品牌热水器优点与不足3.各个品牌热水器卖点......带分词处理流程
2024/10/12 14:52:12 1.47MB 数据分析 京东客户评价 情感分析 分词
1
主要是读取文本,然后进行分词、词干提取、去停用词、计算词频,有界面,很实用
2024/10/6 4:02:25 71KB 分词 去停用词 词频计算
1
共 203 条记录 首页 上一页 下一页 尾页
在日常工作中,钉钉打卡成了我生活中不可或缺的一部分。然而,有时候这个看似简单的任务却给我带来了不少烦恼。 每天早晚,我总是得牢记打开钉钉应用,点击"工作台",再找到"考勤打卡"进行签到。有时候因为工作忙碌,会忘记打卡,导致考勤异常,影响当月的工作评价。而且,由于我使用的是苹果手机,有时候系统更新后,钉钉的某些功能会出现异常,使得打卡变得更加麻烦。 另外,我的家人使用的是安卓手机,他们也经常抱怨钉钉打卡的繁琐。尤其是对于那些不太熟悉手机操作的长辈来说,每次打卡都是一次挑战。他们总是担心自己会操作失误,导致打卡失败。 为了解决这些烦恼,我开始思考是否可以通过编写一个全自动化脚本来实现钉钉打卡。经过一段时间的摸索和学习,我终于成功编写出了一个适用于苹果和安卓系统的钉钉打卡脚本。
2024-04-09 15:03 15KB 钉钉 钉钉打卡