jieba分词,连接数据库,分析数据库中的文本,并提取时间、地点、目标,整个完好流程/
1
中文信息计算机自动处理的研究已有几十年的历史,但至今仍有许多技术难题没有得到很好处理,中文姓名自动识别问题就是其中的一个。
由于它与中文文本的自动分词一样,属于中文信息处理的基础研究领域,因而它的研究成果直接影响到中文信息的深层次研究。
汉语的自身特点使得中文信息自动处理大多是先对要处理的文本进行自动分词(加入显式分割符),然后再在分词的基础上进行词法、语法、语义等方面的深入分析。
而在分词阶段,文本中的人名、地名以及其它专有名词和生词大多被切分成单字词,在这种情形下如不能很好地处理汉语文本中专有名词生词的识别问题,将给其后的汉语文本的深入分析带来难以逾越的障碍。
中文姓名的自动识别问题就是在这种背景下提出来的。
对这一问题的研究目前采用的技术中主要利用以下几方面的信息:姓名用字的频率信息、上下文信息[1,2]、语料库统计信息[2]、词性信息等[3]。
本文的方法是,首先对中文人名的构成、姓名用字的规律及上下文文本信息特征进行充分分析,在此基础上建立起两组规则集,将其作用于测试文本,获得初步识别结果,再利用大规模语料库的统计信息对初步识别结果进行概率筛选,设定合适的阈值,输出最终识别结果。
经对50多万字的开放语料测试,系统自动识别出1781个中文人名,在不同的筛选阈值下获得90%以上的识别准确率,而召回率高于91%。
2018/8/19 23:04:07 83KB 中文分词 搜索引擎 人名 自动
1
hmm实现的中文分词系统;
一个简单的宋词生成系统;
包括一个简单网页界面;
1
适合机器学习或训练、输出法词库、分词等
2015/7/7 13:17:22 11.46MB 词库 输入法 机器学习
1
在jdk为1.7当中,不支持elasticSearch2.4以上,这里的资源为elasticSearch2.3.5加上对应elasticSearch版本的ik分词器,和gson的jar包,可以处理json到实体类,map,list的转换。
在项目中会运用到
2015/5/22 13:44:12 30.75MB 全文检索
1
elasticsearch的紧缩包,解压下来即用,有两个版本的分别是elasticsearch-6.4.3,还附带6.4.3的IK分词器
2016/5/5 21:26:50 89.81MB elasticsearch
1
分了26类的体育语料,包括棒球帆船击剑举重篮球垒球马术排球皮划艇乒乓球曲棍球拳击柔道赛艇射击射箭手球摔跤跆拳道体操田径网球游泳羽毛球自行车足球等领域,在每个文件夹中的all.txt文件已经分词处理,可用于自然言语处理
2021/6/15 4:33:39 8.35MB 体育 分词 语料
1
使用visualstudio开发的lucene.net和盘古分词实现全文检索。
并按照lucene的得分算法进行多条件检索并按照得分算法计算婚配度排序。
可以输入一句话进行检索。
lucene.net的版本为2.9.2盘古分词的版本为2.3.1并实现了高亮功能。
高亮上使用的是盘古分词的高亮算法。
有点小bug,在这个字段没有关键字的时候可能会不显示数据,如果要是只看全文检索,可以自己去掉高亮,看一下检索结果。
2017/10/2 22:18:15 2.24MB lucene.net 盘古分词 c# C#
1
版本要求最低VS2010及以上都可以完美打开,分词辅助类,汉字转拼音,加密,日历,时间操作类,随机类,条形码,序列号,验证码,音频视频转换类,各种运算集合,正则表达式,字符,文件读写,Ini文件,图片,画图,邮件,各种Chart图,Excel/word/PDF等文件类型导出,等等100+类库,收集好几年了,分享给大家,希望能协助到初学者!
2020/2/19 18:03:15 6.87MB C# source code
1
使用Python,对爬取微博的评论,进行jieba分词,统计词频,修正路径即可。
2015/4/27 23:42:27 835B jieba 分词 微博评论
1
共 215 条记录 首页 上一页 下一页 尾页
在日常工作中,钉钉打卡成了我生活中不可或缺的一部分。然而,有时候这个看似简单的任务却给我带来了不少烦恼。 每天早晚,我总是得牢记打开钉钉应用,点击"工作台",再找到"考勤打卡"进行签到。有时候因为工作忙碌,会忘记打卡,导致考勤异常,影响当月的工作评价。而且,由于我使用的是苹果手机,有时候系统更新后,钉钉的某些功能会出现异常,使得打卡变得更加麻烦。 另外,我的家人使用的是安卓手机,他们也经常抱怨钉钉打卡的繁琐。尤其是对于那些不太熟悉手机操作的长辈来说,每次打卡都是一次挑战。他们总是担心自己会操作失误,导致打卡失败。 为了解决这些烦恼,我开始思考是否可以通过编写一个全自动化脚本来实现钉钉打卡。经过一段时间的摸索和学习,我终于成功编写出了一个适用于苹果和安卓系统的钉钉打卡脚本。
2024-04-09 15:03 15KB 钉钉 钉钉打卡