搜狐新闻分类语料库,主要包含0汽车1财经2IT3健康4体育5旅游6教育7招聘8文化9军事十个分类,共50多万条记录
2024/3/7 8:48:42 65.37MB 搜狐 语料库 分类
1
人民日报语料库,适合机器学习训练使用,分词等。
2024/2/28 18:23:12 17.65MB 语料
1
轮廓分析概括coRPysprofiling是一个开放源代码库,旨在将探索性数据分析和可视化引入自然语言处理领域。
软件包中的函数将用于为单个文本语料库提供一些基本统计信息和可视化效果,或者提供将多个语料库彼此进行比较的功能。
安装您可以使用以下方法从安装coRPysprofiling的发行版本:install.packages("coRPysprofiling")特征一些特定功能包括:corpus_analysis:语料库分析将生成有关单个语料库特征的统计报告(例如,唯一单词数,平均单词/句子长度,使用的最高单词,主题分析)。
corpus_viz:corpus_viz将生成单个语料库的相关可视化效果(例如,词云,平均单词/句子长度的直方图,使用的最高单词)。
corpora_compare:给定两个或多个语料库,corpora_compare将在每对语料库之
2024/2/23 18:47:48 6KB R
1
基于已知的语料库,实现高效的n-gram算法,python实现
2024/2/9 2:29:18 2.83MB n-gram 计算机语言学 python
1
统计自然语言处理第二版宗成庆pdf是一本经过第二次更新的统计自然语言方面的教材。
自然语言作为人类思想情感最基本,最直接,最方便的表达工具,无时无刻不充斥在人类社会的各个角落。
小编推荐的这本统计自然语言处理全面介绍了统计自然语言处理的基本概念、理论方法和新研究进展,内容包括形式语言与自动机及其在自然语言处理中的应用、语言模型、隐马尔可夫模型、语料库技术、汉语自动分词与词性标注、句法分析、词义消歧、篇章分析、统计机器翻译、语音翻译、文本分类、信息检索与问答系统、自动文摘和信息抽取、口语信息处理与人机对话系统等,既有对基础知识和理论模型的介绍,也有对相关问题的研究背景、实现方法和技术现状的详细阐述。
2024/2/2 9:26:17 16.87MB 自然语言处理 nlp
1
人民网新闻语料库,解压后包含人民网,中新网等最新的几百条新闻,txt的形式
2024/1/26 11:56:33 2.31MB txt 语料库
1
中文维基百科语料库,将其转换为文本文件后,进行繁体字转换为简体字,字符集转换,分词,然后训练得到模型以及向量。
由于文件上传的大小限制是60MB,我这里的压缩包中有model,然后对向量提供了下载链接。
使用python中的gensim包进行训练得到的,运行时间较长,希望对你们有帮助。
2024/1/26 7:53:54 15.2MB word2vec
1
训练集
2024/1/20 21:02:01 144.1MB 文本分类
1
搜狗最新文本分类语料库C000007汽车C000008财经C000010ITC000013健康C000014体育C000016旅游C000020教育C000022招聘C000023文化C000024军事
1
IMIT语料库包括一些与话语句子相关的文件,除了语音波形文件(.wav)外,还包括对应的句子内容(.txt),经过时间对齐(time-aligned)的单词内容(.wrd),经过时间对齐(time-aligned)的音素内容(.phn)三种类型的文件。
2023/12/24 10:43:08 6.75MB TIMIT
1
共 116 条记录 首页 上一页 下一页 尾页
在日常工作中,钉钉打卡成了我生活中不可或缺的一部分。然而,有时候这个看似简单的任务却给我带来了不少烦恼。 每天早晚,我总是得牢记打开钉钉应用,点击"工作台",再找到"考勤打卡"进行签到。有时候因为工作忙碌,会忘记打卡,导致考勤异常,影响当月的工作评价。而且,由于我使用的是苹果手机,有时候系统更新后,钉钉的某些功能会出现异常,使得打卡变得更加麻烦。 另外,我的家人使用的是安卓手机,他们也经常抱怨钉钉打卡的繁琐。尤其是对于那些不太熟悉手机操作的长辈来说,每次打卡都是一次挑战。他们总是担心自己会操作失误,导致打卡失败。 为了解决这些烦恼,我开始思考是否可以通过编写一个全自动化脚本来实现钉钉打卡。经过一段时间的摸索和学习,我终于成功编写出了一个适用于苹果和安卓系统的钉钉打卡脚本。
2024-04-09 15:03 15KB 钉钉 钉钉打卡