统计自然语言处理第二版宗成庆pdf是一本经过第二次更新的统计自然语言方面的教材。
自然语言作为人类思想情感最基本,最直接,最方便的表达工具,无时无刻不充斥在人类社会的各个角落。
小编推荐的这本统计自然语言处理全面介绍了统计自然语言处理的基本概念、理论方法和新研究进展,内容包括形式语言与自动机及其在自然语言处理中的应用、语言模型、隐马尔可夫模型、语料库技术、汉语自动分词与词性标注、句法分析、词义消歧、篇章分析、统计机器翻译、语音翻译、文本分类、信息检索与问答系统、自动文摘和信息抽取、口语信息处理与人机对话系统等,既有对基础知识和理论模型的介绍,也有对相关问题的研究背景、实现方法和技术现状的详细阐述。
2024/2/2 9:26:17 16.87MB 自然语言处理 nlp
1
人民网新闻语料库,解压后包含人民网,中新网等最新的几百条新闻,txt的形式
2024/1/26 11:56:33 2.31MB txt 语料库
1
中文维基百科语料库,将其转换为文本文件后,进行繁体字转换为简体字,字符集转换,分词,然后训练得到模型以及向量。
由于文件上传的大小限制是60MB,我这里的压缩包中有model,然后对向量提供了下载链接。
使用python中的gensim包进行训练得到的,运行时间较长,希望对你们有帮助。
2024/1/26 7:53:54 15.2MB word2vec
1
训练集
2024/1/20 21:02:01 144.1MB 文本分类
1
搜狗最新文本分类语料库C000007汽车C000008财经C000010ITC000013健康C000014体育C000016旅游C000020教育C000022招聘C000023文化C000024军事
1
IMIT语料库包括一些与话语句子相关的文件,除了语音波形文件(.wav)外,还包括对应的句子内容(.txt),经过时间对齐(time-aligned)的单词内容(.wrd),经过时间对齐(time-aligned)的音素内容(.phn)三种类型的文件。
2023/12/24 10:43:08 6.75MB TIMIT
1
数据集用于语音情感分析训练数据库。
可以用于机器学习,深度学习。
该数据集是CASIA语料库,该数据只用于学习。
2023/12/19 14:24:35 95.59MB 语音 情感分析 训练集
1
微信或QQ聊天机器人的语料库和知识库,图灵机器人的知识库或语料库
1
网上流传的人民日报1998年1月份的语料库,北京大学开发;
处理成了crf分词训练语料的格式;
2023/12/12 10:08:19 2.32MB 语料库 中文分词 人民日报 crf
1
LatentDirichletAllocation(LDA)是一种文档主题生成模型,也称为一个三层贝叶斯概率模型,包含词、主题和文档三层结构。
LDA是一种非监督机器学习技术,可以用来识别大规模文档集(documentcollection)或语料库(corpus)中潜藏的主题信息。
此文档是LDA论文的翻译。
2023/12/8 20:43:03 498KB LDA
1
共 122 条记录 首页 上一页 下一页 尾页
在日常工作中,钉钉打卡成了我生活中不可或缺的一部分。然而,有时候这个看似简单的任务却给我带来了不少烦恼。 每天早晚,我总是得牢记打开钉钉应用,点击"工作台",再找到"考勤打卡"进行签到。有时候因为工作忙碌,会忘记打卡,导致考勤异常,影响当月的工作评价。而且,由于我使用的是苹果手机,有时候系统更新后,钉钉的某些功能会出现异常,使得打卡变得更加麻烦。 另外,我的家人使用的是安卓手机,他们也经常抱怨钉钉打卡的繁琐。尤其是对于那些不太熟悉手机操作的长辈来说,每次打卡都是一次挑战。他们总是担心自己会操作失误,导致打卡失败。 为了解决这些烦恼,我开始思考是否可以通过编写一个全自动化脚本来实现钉钉打卡。经过一段时间的摸索和学习,我终于成功编写出了一个适用于苹果和安卓系统的钉钉打卡脚本。
2024-04-09 15:03 15KB 钉钉 钉钉打卡