首页
熊猫办公下载
文件下载
根据地址查询经纬度
登录 / 注册
一级分类:
安全技术
存储
操作系统
服务器应用
行业
课程资源
开发技术
考试认证
数据库
网络技术
信息化
移动开发
云计算
大数据
跨平台
音视频
游戏开发
人工智能
区块链
二级分类:
正向最大匹配中文分词算法
中文分词一直都是中文自然语言处理领域的基础研究。
目前,网络上流行的很多中文分词软件都可以在付出较少的代价的同时,具备较高的正确率。
而且不少中文分词软件支持Lucene扩展。
但不管实现如何,目前而言的分词系统绝大多数都是基于中文词典的匹配算法。
其中最为常见的是最大匹配算法(MaximumMatching,以下简称MM算法)。
MM算法有三种:一种正向最大匹配,一种逆向最大匹配和双向匹配。
本程序实现了正向最大匹配算法。
3.55MB
中文分词
最大匹配
正向最大匹配
用c/c++完成一
1
MyTxtSegTag分词和词性标注工具
MyTxtSegTag分词和词性标注工具.exe
2025/11/26 6:17:19
3.46MB
分词
词性标注
工具
1
IKAnalyzer中文分词支持lucene6.5.0版本
由于林良益先生在2012之后未对IKAnalyzer进行更新,后续lucene分词接口发生变化,导致不可使用,所以此jar包支持lucene6.0以上版本
2025/11/23 17:44:21
5.46MB
IKAnalyzer
lucene6
1
淘宝商品词库
淘宝搜索数据,网络购物必备词库电子商务建站必备,分词词库。
下载文件里面包括:淘宝专业商品分词词库.scel;
淘宝专业商品分词词库.txt;
商品名称大全(搜狗词库).scel;商品名称大全(搜狗词库).txt;词库转换工具.exe;
2025/11/6 1:16:38
1.11MB
商品词库
淘宝商品词库
品牌词库
1
en_core_web_sm-2.0.0.tar.gz
Spacy是自然语言处理需要使用的一个工具包,加载模型后就可以做分词,词性标注等任务啦。
当你执行这条命令python-mspacydownloaden。
但是没有网的时候,可能这个包有用。
spaCy>=2.0.0a18
2025/9/20 8:41:05
35.62MB
spacy_model
en_core_web_
1
ROST内容挖掘软件
ROSTCM6是武汉大学沈阳教授研发编码的国内目前唯一的以辅助人文社会科学研究的大型免费社会计算平台。
该软件可以实现微博分析、聊天分析、全网分析、网站分析、浏览分析、分词、词频统计、英文词频统计、流量分析、聚类分析等一系列文本分析,用户量超过7000,遍布海内外100多所大学,包括剑桥大学、日本北海道大学、北京大学、清华大学、香港城市大学、澳门大学众多高校。
写论文的一把利器,精通ROSTCM,一周写出SSCI不成问题
2025/9/4 0:34:52
10.77MB
ROSTCM6.zip
1
手机评论的用户词典
在进行文本情感分类时,对文本数据需要进行分词处理,为了提高分词的准确性,需要加入用户词典,本文是针对手机评论数据整理出的用户词典。
2025/9/3 17:54:46
3KB
文档
1
ASP.Net常用工具类《很全面》
文件上传js、Chart图形、Cookie&Session&Cache、CSV文件转换、DEncrypt、FTP操作类、JS、Json、Mime、PDF、Properties、ResourceManager、XML操作类、弹出消息类、导出Excel、分词辅助类、汉字转拼音、配置文件操作类、日历、上传下载、时间操作类、视频转换类、随机数类、条形码、图片、网络、文件操作类、序列化、压缩解压缩、验证码、页面辅助类、邮件、邮件2、正则表达式、字符串、SSO、SEO、过滤器、C#连接linux终端等等几十个工具操作类.
2025/9/1 16:31:46
4.94MB
asp.net
1
人工智能大作业.zip
涉及知识表示与推理,机器学习,自然语言处理(词云、分词)的一个五子棋对战系统。
采用java语言编写。
中有完整代码,讲解视频,项目报告,一应俱全。
2025/8/20 4:24:42
38.42MB
人工智能,机器学习,自然语言处理
1
贝叶斯分类实现垃圾信息分类支持中文分词
基于贝叶斯分类的中文垃圾信息分类识别核心核心代码,可直接运行的源程序。
publicvoidloadTrainingDataChinies(FiletrainingDataFile,StringinfoType){//加载中文分词其NLPIR.init("lib");//System.out.println(trainingDataFile.isFile()+"==============");//尝试加载学习数据文件try{//针对学习数据文件构建缓存的字符流,利用其可以采用行的方式读取学习数据BufferedReaderfileReader=newBufferedReader(newFileReader(trainingDataFile));//定义按照行的方式读取学习数据的临时变量Stringdata="";//循环读取学习文件中的数据while((data=fileReader.readLine())!=null){//System.out.println("*****************************");//System.out.println(data+"000000000000000000000");//按照格式分割字符串,将会分割成两部分,第一部分为ham或spam,用于说明本行数据是有效消息还是垃圾消息,第二部分为消息体本身//String[]datas=data.split(":");//对消息体本身进行简单分词(本学习数据均为英文数据,因此可以利用空格进行自然分词,但是直接用空格分割还是有些简单粗暴,因为没有处理标点符号,大家可以对其进行扩展,先用正则表达式处理标点符号后再进行分词,也可以扩展加入中文的分词功能)//首先进行中文分词//System.out.println(datas[1]+"------------------------");//if(datas.length>1){//System.out.println(datas.length);Stringtemp=NLPIR.paragraphProcess(data,0);//System.out.println(temp);String[]words=temp.split("");
2025/8/1 3:41:15
14KB
垃圾信息
文本分类
贝叶斯
1
共 226 条记录
首页
上一页
下一页
尾页
钉钉无人值守自动打卡脚本 永不迟到的神器 安卓和苹果教程
New!
在日常工作中,钉钉打卡成了我生活中不可或缺的一部分。然而,有时候这个看似简单的任务却给我带来了不少烦恼。 每天早晚,我总是得牢记打开钉钉应用,点击"工作台",再找到"考勤打卡"进行签到。有时候因为工作忙碌,会忘记打卡,导致考勤异常,影响当月的工作评价。而且,由于我使用的是苹果手机,有时候系统更新后,钉钉的某些功能会出现异常,使得打卡变得更加麻烦。 另外,我的家人使用的是安卓手机,他们也经常抱怨钉钉打卡的繁琐。尤其是对于那些不太熟悉手机操作的长辈来说,每次打卡都是一次挑战。他们总是担心自己会操作失误,导致打卡失败。 为了解决这些烦恼,我开始思考是否可以通过编写一个全自动化脚本来实现钉钉打卡。经过一段时间的摸索和学习,我终于成功编写出了一个适用于苹果和安卓系统的钉钉打卡脚本。
2024-04-09 15:03
15KB
钉钉
钉钉打卡
个人信息
点我去登录or注册
|
微信登录
一言
热门下载
双系统双频伪距单点定位程序
数据库系统概论第五版
中科院考博英语2009-2018年试题及答案解析(十五套436面).pdf
Docker构建tomcat镜像jdk1.8+tomcat9.zip
飘逸传世引擎源代码
ABAQUS金属非稳态和稳态切削过程的模拟分析_张东进.pdf
HTML5+CSS3中文参考手册(3手册)chm版中文参考手册打包
新升级版TP5商城小程序源码+公众号版+h5一整套源码V3.zip
StimulsoftReports2020.1.1License.rar
CNS2_CN_VW_P0095D_0332.7z
KEPServerEXV6.7.zip
几何画板课件350套.zip
R9390系列BIOS修改和风扇调速工具
ENVI去云补丁Haze_tool文件及其使用说明和安装方法
vue项目demo(asp.netmvc5+vue2.5)
最新下载
智慧城市安全体系标准(意见稿)
usbcan(c#实例)
linux音乐播放器
LeetCode:地里刨食的野猪-源码
JavaRSA,MD5string,MD5File,DES,ELGamal算法实现+RSA数字签名
prius电机ansoft仿真
滴水逆向教材及笔记
自编PID控制水箱液位
openwrtmt7688/mt7628pwmdriver驱动
ssm代码生成器,后台代码一键生成器
ParticlePath
基于简单IO口的显示语音播放器
PInetwork项目介绍.pdf
IFRS和USGAAP辨析汇总.pdf
数学建模教程matlab数学建模模型编程实例
其他资源
PSS/E动态仿真完全手册
Mysql_妹妹m_rpm.rar
GameProgra妹妹ingPatterns(中文版)
dns2tcp官方最新版+可用的客户端(DNS隧道转发TCP连接的工具)
madhuweb:学习网页汇合-源码
python实现天气查询,还添加了界面,可直接运行和打包
while_loop.py
android一个简单的阅读器源码
快速理解ClickHouse原理
校园bbs网站
蓝桥杯单片机历年真题锦(含二到九届的真题与题目)史上最全
计算机操作零碎课件(考研)
matlab边缘图像检测几种算法GUI界面
Norflashcontroller代码设计和文档说明,wishbone总线接口的
视觉slamMATLAB仿真
基于颜色的matlab代码
abaqus经典例题集
第二学期教育教学工作总结.doc
【桌面零碎】51单片机+DAC0832组成的三角波发生器电路(包含源代码和Proteus仿真电路)
secoclient_3.0.3.21.zip