自然语言处理课程的小作业,以新闻语料为基础,用HMM算法实现中文分词。
按照每个字为B,E,S,M进行划分。
以新闻语料为基础,用HMM算法实现中文分词。
按照每个字为B,E,S,M进行划分。
2025/6/3 8:36:25 2.25MB HMM
1
用C语言编写的源代码.实现了准确的中文分词.
2025/5/18 21:53:30 5KB 中文分词 分词
1
使用keras实现的基于Bi-LSTMCRF的中文分词词性标注
2025/5/6 2:42:07 113KB Python开发-自然语言处理
1
达观数据NLP特刊:从原理到实践,包含基于深度学习的中文分词,个性化推荐,搜索引擎排序,推荐系统冷启动问题解决方案
1
程序用java编写后向算法中文分词分词,并建立倒排索引表。
然后在myeclipse下编写一个web形式的搜索测试页。
2025/3/24 1:38:02 2.7MB 倒排索引 搜索引擎 java 中文分词
1
从c#基础开始,逐渐深入,是学习搜索引擎开发的*。
应众多公司的实际需求,《使用c#开发搜索引擎》介绍如何以c#作为工具开发搜索引擎。
全书以完成一个网站搜索\垂直搜索作为目标,从网络爬虫抓取数据开始,然后到中文分词、文本排重等文本挖掘技术和搜索结果展现。
本书是市面上介绍业界热门的lucene.net、使用webbrowser做爬虫以及结合solr开发asp.net搜索的第一书。
  《使用c#开发搜索引擎》适合专业软件开发人员,也适合于希望学习搜索引擎工作原理的读者学习使用。
本书对于在校学生学习复杂数据结构和应用动态规划等常用算法也有参考价值。
2025/3/20 1:47:48 95.02MB C# PDF Lucene.Net
1
中科院的中文分词系统ICTCLAS是从事文本挖掘研究工作的学者们所广泛使用的软件,在此就不多作介绍了。
这是该软件的2015版本,欢迎各位学者下载使用。
2025/2/27 10:55:02 49.06MB ICTCLAS2015
1
中文分词;文本分类;信息抽取;语义理解;问答系统;自然语言对话系统
2025/2/21 17:48:20 3.81MB NLP
1
汇总的中文分词词库,分为两个目录:1、中文分词词库汇总。
包含10个词库,文件名字表示里面词的数量(单位是千),如150.txt,表示包含15万词。
2、主流分词工具的词库。
包含word/jieba/mmseg/IK分词工具的最近词库。
注意:分词时,不一定是词库中的词越多,效果越好。
2025/1/28 7:47:49 10.34MB 中文分词 分词 词库 分词词库
1
基于C++编写的中文分词程序,内有完整的代码,且有小词库,解压即可运行
2024/12/8 20:52:11 28KB 分词
1
共 70 条记录 首页 上一页 下一页 尾页
在日常工作中,钉钉打卡成了我生活中不可或缺的一部分。然而,有时候这个看似简单的任务却给我带来了不少烦恼。 每天早晚,我总是得牢记打开钉钉应用,点击"工作台",再找到"考勤打卡"进行签到。有时候因为工作忙碌,会忘记打卡,导致考勤异常,影响当月的工作评价。而且,由于我使用的是苹果手机,有时候系统更新后,钉钉的某些功能会出现异常,使得打卡变得更加麻烦。 另外,我的家人使用的是安卓手机,他们也经常抱怨钉钉打卡的繁琐。尤其是对于那些不太熟悉手机操作的长辈来说,每次打卡都是一次挑战。他们总是担心自己会操作失误,导致打卡失败。 为了解决这些烦恼,我开始思考是否可以通过编写一个全自动化脚本来实现钉钉打卡。经过一段时间的摸索和学习,我终于成功编写出了一个适用于苹果和安卓系统的钉钉打卡脚本。
2024-04-09 15:03 15KB 钉钉 钉钉打卡