首页
熊猫办公下载
文件下载
根据地址查询经纬度
登录 / 注册
一级分类:
安全技术
存储
操作系统
服务器应用
行业
课程资源
开发技术
考试认证
数据库
网络技术
信息化
移动开发
云计算
大数据
跨平台
音视频
游戏开发
人工智能
区块链
二级分类:
中文分词词库汇总
汇总的中文分词词库,分为两个目录:1、中文分词词库汇总。
包含10个词库,文件名字表示里面词的数量(单位是千),如150.txt,表示包含15万词。
2、主流分词工具的词库。
包含word/jieba/mmseg/IK分词工具的最近词库。
注意:分词时,不一定是词库中的词越多,效果越好。
2025/1/28 7:47:49
10.34MB
中文分词
分词
词库
分词词库
1
C++中文分词系统代码
基于C++编写的中文分词程序,内有完整的代码,且有小词库,解压即可运行
2024/12/8 20:52:11
28KB
分词
1
八斗学院大数据第九期
第一阶段:这一阶段会学习MapReduce、Hive、HDFS、Yarn、Spark等计算框架的开发技术,以及Scala编程语言。
通过项目实践,你能快速掌握这些技术,获得数据开发、数据挖掘、机器学习等职位必备的基本开发能力。
第二阶段:这一阶段会学习FLume、Kafka、SparkStreaming、Flink/Storm、Zookeeper、HBase等计算框架的开发技术,以及大数据体系内的数据采集和数据仓库理论思想和技术实现。
通过项目实践,你能快速掌握这些技术,获得完整的大数据架构开发能力。
第三阶段:这一阶段会学习NLP文本相似度、中文分词、HMM算法、推荐算法CF、回归算法等应用与开发技术,整体认识商业项目-音乐推荐系统。
使用海量真实数据对大数据平台和算法进行应用实践,快速掌握大数据行业具有巨大价值的核心技术。
第四阶段:这一阶段会学习分类算法、聚类算法、分类算法-决策树、分类算法-SVM、神经网络+深度学习,深化前3阶段技术能力,初入机器学习领域。
通过对机器学习核心算法的强化练习,你将能完美胜任目前人才最紧缺的数据挖掘开发职位。
2024/10/13 15:34:27
128B
大数据
机器学习
数据挖掘
1
传智播客---lucene入门
目录介绍1、Lucene介绍a)什么是luceneb)全文检索的应用场景c)全文检索定义2、Luence实现全文检索的流程(重点)3、入门程序4、Field域(重点)5、索引维护a)添加索引b)删除索引c)修改索引6、搜索(重点)a)通过Query子类创建查询对象b)通过QueryParser创建查询对象7、相关度排序8、中文分词器(重点)
2024/9/25 8:04:19
1.1MB
lucene
传智播客
快速入门
1
中文分词词典-54w条词语
中文分词词典适合最大正向匹配算法使用共计548389条词语
2024/9/19 10:23:23
1.7MB
中文分词
正向最大匹配
自然语言理解
1
中文分词+关键字提取
1:中文分词2:词频统计3:罗列出要自动提取的关键字----------------------------------------具有60万字/秒的高速处理能力。
2024/8/29 7:46:11
2.6MB
中文分词
关键字提取
1
solr7相关资料包.zip
由于官网下载solr太慢,所以放这里,里面有solr-7.7.3和定时更新solr索引的jar包还有ik中文分词器中文jar包
2024/8/4 8:01:05
164.99MB
solr
1
基于词内部结合度和边界自由度的新词发现
新词发现作为自然语言处理领域的一项基础研究,一直受到学术界和企业界的广泛关注。
将新词发现问题转换为确定词语边界问题。
首先对语料进行中文分词,然后统计"散串",最后提出一种基于词内部结合度和边界自由度的新词发现方法。
通过在大规模语料上进行新词发现实验,验证了该方法的有效性。
今后的研究重点将放在如何有效地识别低频新词上,以提高系统的整体性能。
2024/7/27 6:16:20
249KB
新词发现;
内部结合度;
边界自由度
1
最新中文分词词库整理
最新中文分词词库整理,中文分词,词库,四十万可用搜狗txt词库,30万中文分词词库,百度分词词库,四十万汉语大词库
2024/7/22 12:21:26
6.36MB
中文分词
词库
1
rostcm6中文分词软件
大数据时代,中文的语义分析变得非常重要,这是一个可以中文分词的小插件,由武大沈阳教授团队开发的。
2024/7/7 6:14:54
8.61MB
rost
cm
1
共 72 条记录
首页
上一页
下一页
尾页
钉钉无人值守自动打卡脚本 永不迟到的神器 安卓和苹果教程
New!
在日常工作中,钉钉打卡成了我生活中不可或缺的一部分。然而,有时候这个看似简单的任务却给我带来了不少烦恼。 每天早晚,我总是得牢记打开钉钉应用,点击"工作台",再找到"考勤打卡"进行签到。有时候因为工作忙碌,会忘记打卡,导致考勤异常,影响当月的工作评价。而且,由于我使用的是苹果手机,有时候系统更新后,钉钉的某些功能会出现异常,使得打卡变得更加麻烦。 另外,我的家人使用的是安卓手机,他们也经常抱怨钉钉打卡的繁琐。尤其是对于那些不太熟悉手机操作的长辈来说,每次打卡都是一次挑战。他们总是担心自己会操作失误,导致打卡失败。 为了解决这些烦恼,我开始思考是否可以通过编写一个全自动化脚本来实现钉钉打卡。经过一段时间的摸索和学习,我终于成功编写出了一个适用于苹果和安卓系统的钉钉打卡脚本。
2024-04-09 15:03
15KB
钉钉
钉钉打卡
个人信息
点我去登录or注册
|
微信登录
一言
热门下载
双系统双频伪距单点定位程序
Docker构建tomcat镜像jdk1.8+tomcat9.zip
中科院考博英语2009-2018年试题及答案解析(十五套436面).pdf
飘逸传世引擎源代码
vue项目demo(asp.netmvc5+vue2.5)
几何画板课件350套.zip
R9390系列BIOS修改和风扇调速工具
CNS2_CN_VW_P0095D_0332.7z
ABAQUS金属非稳态和稳态切削过程的模拟分析_张东进.pdf
高光谱和LiDAR多模态遥感图像分类数据集
新升级版TP5商城小程序源码+公众号版+h5一整套源码V3.zip
吉利新金刚2016款车机导航系统
ENVI去云补丁Haze_tool文件及其使用说明和安装方法
HTML5+CSS3中文参考手册(3手册)chm版中文参考手册打包
KEPServerEXV6.7.zip
最新下载
32个GPS坐标(用于测试轨迹画线)
linux下C++俄罗斯方块源码免费下载.zip
IPFIX技术白皮书
电子借条系统链改.pdf
程序-MATLAB-小波分解(6层),通过编译,直接运行
cisco2960dot1x配置
CAD图纸转T3格式,免安装
世界地图学习数据
TA_Lib-0.4.17-cp37-cp37m-win_amd64.whl
ASP.NET物流信息管理系统(源码+数据库)
Z变换(拉普拉斯变换)_PPT讲解
rabbitmq-server-windows-3.8.9,内含延迟插件(rabbitmq_delayed_message_exchange-3.8.0.ez)
数据库表的琐碎知识.sql
nes-rust-ecsy:NES模拟器+ECSY+Webpack捆绑包-源码
其他资源
【小法式】10.如何读写INI文件?(VisualC++编程源代码)
数字信号处理(2-5章)课后答案
自行车商店调度程序:SOT-项目6-JO,AP,K。M-源码
MediaCreationToolx64
《HDFS——Hadoop分布式文件零碎深度实践》PDF
停车管理零碎.zip
捷讯收银台开源版含所有运营文档打印机控件等
android每日定时功能
WDF资源提取源码
模仿一个小型磁盘文件管理系统
S1Sh的整合jar包
detectionClient_install探针异网路由流量探测.exe
《软件评测师教程》柳纯录主编.pdf
详细讲解fpga硬件电路计划计划方法进阶,对应潘松verilogHDL第五版,硬件电路从中级到高级计划。
QT完成图片的简单编辑工具,支持多种图形绘制,支持图元的简单缩放,旋转。(源码)
vap----------.zip
千兆以太网通讯、数据采集、存储显示等_PCB源文件-AD软件.rar
6.1上手演示视频666666666666666
2020年中国效劳器行业概览.pdf
操作系统进程同步问题(吃水果问题)