搜索【中文分词】的结果-好快吧下载

正向最大匹配中文分词算法

中文分词一直都是中文自然语言处理领域的基础研究。
目前，网络上流行的很多中文分词软件都可以在付出较少的代价的同时，具备较高的正确率。
而且不少中文分词软件支持Lucene扩展。
但不管实现如何，目前而言的分词系统绝大多数都是基于中文词典的匹配算法。
其中最为常见的是最大匹配算法(MaximumMatching，以下简称MM算法)。
MM算法有三种：一种正向最大匹配，一种逆向最大匹配和双向匹配。
本程序实现了正向最大匹配算法。

3.55MB 中文分词 最大匹配 正向最大匹配 用c/c++完成一

1

IKAnalyzer中文分词支持lucene6.5.0版本

由于林良益先生在2012之后未对IKAnalyzer进行更新，后续lucene分词接口发生变化，导致不可使用，所以此jar包支持lucene6.0以上版本

2025/11/23 17:44:21 5.46MB IKAnalyzer lucene6

1

贝叶斯分类实现垃圾信息分类支持中文分词

基于贝叶斯分类的中文垃圾信息分类识别核心核心代码，可直接运行的源程序。
publicvoidloadTrainingDataChinies(FiletrainingDataFile,StringinfoType){//加载中文分词其NLPIR.init("lib");//System.out.println(trainingDataFile.isFile()+"==============");//尝试加载学习数据文件try{//针对学习数据文件构建缓存的字符流，利用其可以采用行的方式读取学习数据BufferedReaderfileReader=newBufferedReader(newFileReader(trainingDataFile));//定义按照行的方式读取学习数据的临时变量Stringdata="";//循环读取学习文件中的数据while((data=fileReader.readLine())!=null){//System.out.println("*****************************");//System.out.println(data+"000000000000000000000");//按照格式分割字符串，将会分割成两部分，第一部分为ham或spam,用于说明本行数据是有效消息还是垃圾消息，第二部分为消息体本身//String[]datas=data.split(":");//对消息体本身进行简单分词（本学习数据均为英文数据，因此可以利用空格进行自然分词，但是直接用空格分割还是有些简单粗暴，因为没有处理标点符号，大家可以对其进行扩展，先用正则表达式处理标点符号后再进行分词，也可以扩展加入中文的分词功能）//首先进行中文分词//System.out.println(datas[1]+"------------------------");//if(datas.length＞1){//System.out.println(datas.length);Stringtemp=NLPIR.paragraphProcess(data,0);//System.out.println(temp);String[]words=temp.split("");

2025/8/1 3:41:15 14KB 垃圾信息 文本分类 贝叶斯

1

中文自然语言处理中文分词训练语料

本次提供的中文汉语语料syj_trainCorpus_utf8.txt全网免费，转载需要注明出处，语料是作者通过爬取的短文本和网络上的预料处理、合并生成的。
整个语料大小264M，包含1116903条数据，数据用空格隔开，可以用来训练分词模型。

2025/7/17 17:47:24 108.12MB NLP 语料 中文分词语料 中文语料

1

HMM实现中文分词python实现作业

自然语言处理课程的小作业，以新闻语料为基础，用HMM算法实现中文分词。
按照每个字为B，E，S，M进行划分。
以新闻语料为基础，用HMM算法实现中文分词。
按照每个字为B，E，S，M进行划分。

2025/6/3 8:36:25 2.25MB HMM

1

C语言中文分词源代码

用C语言编写的源代码.实现了准确的中文分词.

2025/5/18 21:53:30 5KB 中文分词 分词

1

Python-使用keras实现的基于BiLSTMCRF的中文分词词性标注

使用keras实现的基于Bi-LSTMCRF的中文分词词性标注

2025/5/6 2:42:07 113KB Python开发-自然语言处理

1

达观数据NLP特刊：从原理到实践.pdf

达观数据NLP特刊：从原理到实践，包含基于深度学习的中文分词，个性化推荐，搜索引擎排序，推荐系统冷启动问题解决方案

2025/4/11 5:29:17 21.52MB 达观数据 数据挖掘 个性化推荐 中文分词

1

基于倒排索引表的搜索引擎简单实现

程序用java编写后向算法中文分词分词，并建立倒排索引表。
然后在myeclipse下编写一个web形式的搜索测试页。

2025/3/24 1:38:02 2.7MB 倒排索引 搜索引擎 java 中文分词

1

使用C#开发搜索引擎PDF电子书下载带书签目录

从c#基础开始，逐渐深入，是学习搜索引擎开发的*。
应众多公司的实际需求，《使用c#开发搜索引擎》介绍如何以c#作为工具开发搜索引擎。
全书以完成一个网站搜索\垂直搜索作为目标，从网络爬虫抓取数据开始，然后到中文分词、文本排重等文本挖掘技术和搜索结果展现。
本书是市面上介绍业界热门的lucene.net、使用webbrowser做爬虫以及结合solr开发asp.net搜索的第一书。
　　《使用c#开发搜索引擎》适合专业软件开发人员，也适合于希望学习搜索引擎工作原理的读者学习使用。
本书对于在校学生学习复杂数据结构和应用动态规划等常用算法也有参考价值。

2025/3/20 1:47:48 95.02MB C# PDF Lucene.Net

1

钉钉无人值守自动打卡脚本永不迟到的神器安卓和苹果教程 New!

在日常工作中，钉钉打卡成了我生活中不可或缺的一部分。然而，有时候这个看似简单的任务却给我带来了不少烦恼。每天早晚，我总是得牢记打开钉钉应用，点击"工作台"，再找到"考勤打卡"进行签到。有时候因为工作忙碌，会忘记打卡，导致考勤异常，影响当月的工作评价。而且，由于我使用的是苹果手机，有时候系统更新后，钉钉的某些功能会出现异常，使得打卡变得更加麻烦。另外，我的家人使用的是安卓手机，他们也经常抱怨钉钉打卡的繁琐。尤其是对于那些不太熟悉手机操作的长辈来说，每次打卡都是一次挑战。他们总是担心自己会操作失误，导致打卡失败。为了解决这些烦恼，我开始思考是否可以通过编写一个全自动化脚本来实现钉钉打卡。经过一段时间的摸索和学习，我终于成功编写出了一个适用于苹果和安卓系统的钉钉打卡脚本。

2024-04-09 15:03 15KB 钉钉 钉钉打卡

个人信息

一言

热门下载

最新下载

其他资源