在使用StanfordCoreNLP对文本句子进行分析时,需要先对句子进行分词nlp.word_tokenize(sentence)然后对分词后的句子进行句子成分分析nlp.pos_tag(sentence)然后继续进行命名实体识别nlp.ner(sentence)再之后就是句法分析与依存句法分析nlp.parse(sentence)nlp.dependency_parse(sentence)
2023/10/2 13:15:30 5KB 自然语言处理
1
1、 该软件只支持ANSI编码文本,不支持Unicode编码文本。
2、 汉语文本可不进行分词处理。
3、 中英文文本文件要求分别以*.ZH.txt和*.EN.txt方式命名。
4、 数据文件必须严格行对齐,如包含空行也必须达到文本对应,即平行文件的对应行都是空的。
软件不能智能自动对齐语料。
5、 软件支持正则表达式检索。
6、 软件默认支持英文词形还原检索(lemmatizedsearch),如,检索go,可得到含有go、goes、went、going、gone等的平行句对。
去除lemmatized前的复选框,则可以检索实际输入的检索项(比如搜goes,只能得到含goes的平行句对)。
7、 软件还支持对应语言文本中包含或不含(exclude)某词项的检索。
如检索education,以及结果中包含(或不含)“教育”的句对。
8、 结果可存为tab符分隔的文本文件,便于后续分析。
2023/8/23 14:49:52 4.6MB 双语平行语料
1
最新版solr4.3的IK分词器,中文分词效果良好!对付一般的大众分词没有问题
2023/8/21 2:57:24 1.19MB IK分词器 jar
1
javalucene开源全文检索,中文分词组件之je-analysis-1.5.3分词器MManalyzer,lucene-core-2.4.1.jar用在情感分析的文本分词中
2023/8/17 22:11:54 1.57MB lucene
1
Solr6.5IK分词器
2023/8/6 2:15:34 1.12MB Solr IK分词
1
基于python3编写的VSM模型构建样例,包含分词处理后的输入文件以及停用词文件
2023/8/1 6:08:30 320KB python VSM
1
据说是百度分词词库~
2023/7/31 21:42:28 776KB 分词 百度 词库
1
具体描述请看这里http://ansjsun.github.io/ansj_seg/这是最新的ANSJ版本,需要配合另一个tree-splitjar包使用,请从这里下载:http://maven.ansj.org/org/ansj/
2023/7/28 21:47:26 42MB ANSJ 分词工具
1
中文维基百科语料库,将其转换为文本文件后,进行繁体字转换为简体字,字符集转换,分词,然后训练得到模型以及向量。
由于文件上传的大小限制是60MB,而训练后的所有文件大小有1G以上,所以这里只提供了下载链接,地址在网盘中。
使用python中的gensim包进行训练得到的,运行时间较长,纯粹的维基百科中文语料训练后的结果,拿去可以直接使用。
2023/7/28 17:38:49 234B wiki中文
1
freeICTCLAS中科院中文分词(拼音中文输入法设计和源代码).zipICTCLAS源码结构Codes│ICTCLAS_WIN.cppWindows界面的程序│ICTCLAS_Win.dsp│ICTCLAS_WIN.dsw│ICTCLAS_WIN.h│ICTCLAS_Win.exe可执行程序│ICTCLAS_WinDlg.cpp│ICTCLAS_WinDlg.h│resource.h│StdAfx.cpp│StdAfx.h│log.txt日志│ICTCLAS_Win.rcWindows界面的资源│├─Utility共用函数模块│ContextStat.cpp│ContextStat.h│Dictionary.cpp│Dictionary.h│Utility.h│Utility.cpp│├─Unknown未登录词识别模块│UnknowWord.cpp│UnknowWord.h│├─TagHMM标注模块│Span.cpp│Span.h│├─Segment词语切分模块│DynamicArray.h│NShortPath.cpp│NShortPath.h│Queue.cpp│Queue.h│SegGraph.cpp│Segment.cpp│Segment.h│DynamicArray.cpp│SegGraph.h│├─Result结果生成模块│Result.cpp│Result.h│├─Data概率数据文件│lexical.ctx│BigramDict.dct│coreDict.dct│nr.dct│nr.ctx│ns.ctx│ns.dct│tr.dct│tr.ctx│└─resWindows界面的资源
1
共 222 条记录 首页 上一页 下一页 尾页
在日常工作中,钉钉打卡成了我生活中不可或缺的一部分。然而,有时候这个看似简单的任务却给我带来了不少烦恼。 每天早晚,我总是得牢记打开钉钉应用,点击"工作台",再找到"考勤打卡"进行签到。有时候因为工作忙碌,会忘记打卡,导致考勤异常,影响当月的工作评价。而且,由于我使用的是苹果手机,有时候系统更新后,钉钉的某些功能会出现异常,使得打卡变得更加麻烦。 另外,我的家人使用的是安卓手机,他们也经常抱怨钉钉打卡的繁琐。尤其是对于那些不太熟悉手机操作的长辈来说,每次打卡都是一次挑战。他们总是担心自己会操作失误,导致打卡失败。 为了解决这些烦恼,我开始思考是否可以通过编写一个全自动化脚本来实现钉钉打卡。经过一段时间的摸索和学习,我终于成功编写出了一个适用于苹果和安卓系统的钉钉打卡脚本。
2024-04-09 15:03 15KB 钉钉 钉钉打卡