IKAnalyzer2012_u6中文分词器jar包IKAnalyzer2012_u6中文分词器jar包IKAnalyzer2012_u6中文分词器jar包IKAnalyzer2012_u6中文分词器jar包IKAnalyzer2012_u6中文分词器jar包
2023/7/27 18:26:24 1.11MB IKAnalyzer
1
词库包括200W左右的最新词,把这个词库作为搜索引擎分词的标准。
词库包括200W左右的最新词,把这个词库作为搜索引擎分词的标准。
2023/7/23 11:58:40 15.84MB 热词 词库
1
linux版本的elasticsearch-6.4.3-全套(elasticsearch安装包+源码+ik分词器+kibana)
2023/7/19 4:55:46 372.23MB elasticsearch
1
问题发现:本次案例为工作中遇到的实际问题,在语音识别中的语料准备部分,需要从网络中爬取相当数量的相关文本,其中发现爬取到了一些不相关的内容,如何把这些不相关的内容剔除掉成为笔者需要思考的问题。
初步思考:遇到此问题笔者第一时间考虑是将文本分词后向量化,使用聚类看一下分布情况,然而发现在不同训练集中,训练样本变化时,向量随之变化,在测试集中表现一般,在实测中几乎无用。
于是想到向量化的方法问题,使用sklearnCountVectorizer方法进行向量化,仅仅是将所有词频无序的向量化,看到另外博文时,发现应该先将目标主题的文本进行词频统计,将统计结果当做向量化模板,实测发现效果不错,现将此方法分享给大家
1
本报告包括详尽完整的文本分类处理过程,包括语料库的处理、jieba分词、停用词无关词处理、词袋模型的构建(CHI值检验用于特征筛选、tfidf作为特征向量值)。
并用自编朴素贝叶斯以及sklearn包中的SVM进行了文本效果的检测,通过混淆矩阵和roc曲线展现了实现效果。
实验报告写的很详细,不懂的地方可以看报告以及看博客中的部分细节讲解。
2023/7/15 21:32:55 4.05MB 数据挖掘 文本分类
1
IK分词用到的jar包
2023/7/13 9:20:37 1.11MB IK 分词
1
简介SCWS是SimpleChineseWordSegmentation的首字母缩写(即:简易中文分词系统)。
2023/7/11 21:06:09 5.83MB scws php中文分词 中文分词
1
基于条件随机场的中文分词方法,算法和理论介绍
2023/7/11 14:02:01 247KB 中文分词
1
中文分词词库,格式如下:00000001李168n00000002李浩133nr200000003互联网式121b...
2023/7/4 17:46:40 7.18MB 中文分词字典 词性
1
中科院ICTCLAS2014分词系统下载包,文本分析工具,方便使用。
2023/7/3 2:23:14 73.73MB 文本分析工具
1
共 222 条记录 首页 上一页 下一页 尾页
在日常工作中,钉钉打卡成了我生活中不可或缺的一部分。然而,有时候这个看似简单的任务却给我带来了不少烦恼。 每天早晚,我总是得牢记打开钉钉应用,点击"工作台",再找到"考勤打卡"进行签到。有时候因为工作忙碌,会忘记打卡,导致考勤异常,影响当月的工作评价。而且,由于我使用的是苹果手机,有时候系统更新后,钉钉的某些功能会出现异常,使得打卡变得更加麻烦。 另外,我的家人使用的是安卓手机,他们也经常抱怨钉钉打卡的繁琐。尤其是对于那些不太熟悉手机操作的长辈来说,每次打卡都是一次挑战。他们总是担心自己会操作失误,导致打卡失败。 为了解决这些烦恼,我开始思考是否可以通过编写一个全自动化脚本来实现钉钉打卡。经过一段时间的摸索和学习,我终于成功编写出了一个适用于苹果和安卓系统的钉钉打卡脚本。
2024-04-09 15:03 15KB 钉钉 钉钉打卡