OntoNotes5.0的中文部分包括250K字的新闻专线数据,270K字的广播新闻和170K的广播会话。
新闻专线的数据来自中国树库5.0。
250K包括100K的新华新闻数据(chtb_001.fid到chtb_325.fid)和来自Sinorama新闻杂志的150K数据(chtb_1001.fid到chtb_1078.fid)。
广播新闻数据是来自TDT4的274K字,并且是从LDC为自动内容提取(ACE)程序注释的数据中选择的。
已将这些文件的编号chtb_2000.fid分配给chtb_3145.fid。
广播对话数据是170K字,取自LDC的GALE数据。
50K的原始中文数据也用英文注释,另外55K的中文数据代表原始英语广播对话翻译成中文。
Web数据包括215K令牌,其中15K来自P2.5评估,86K来自Dev09数据。
此外,110K的Web数据由40K并行中文源数据和70K并行英文原始数据组成。
电话会话语料库包括大约100K的中文CallHome数据,用解析,命题,名称和共同参考信息注释。
2024/12/4 15:47:12 67.81MB conll Ontonotes
VGGVOC数据集VGG_VOC0712_SSD_300x300_ft_iter_120000.ckpt.zip,VGG_VOC0712_SSD_300x300_iter_120000.ckpt.zip,VGG_VOC0712_SSD_512x512_ft_iter_120000.ckpt.zip
2024/12/4 8:25:36 282.55MB VGG 深度学习 数据集 VOC
DepthwiseConvolution-master.zip
2024/12/2 0:40:52 15KB caffe
目前MIT数据集已经不支持下载,你可以在这得到,该数据集包含png和jpg两种格式,完全满足你的要求
2024/12/1 7:05:57 19.61MB 行人检测
最全的人脸数据库,包含AT&T的人脸库、MIT人脸库、ORL人脸库、Yale人脸库。
本资源可以为做人脸识别的同志们提供一些样本库,方便进行样本训练。
2024/12/1 2:04:34 18.78MB 人脸
中英对照看,熟悉专业的外语词汇,比国内那些考试型教材好多了。
这两本,是我深入机器学习的数学基础书籍。
2024/11/29 0:36:30 84.05MB 国外数学 人工智能
关于BP神经网络深度学习的算法一个易语言编程模块纯源码。
2024/11/28 20:08:20 11KB BP神经网络
mnist手写数字识别matlab
2024/11/28 11:51:29 102.78MB 深度学习
用西门子1200PLC带V90走EPOS模式时,用111报文时需要用到FB284功能块,本文档详细介绍了FB284的应用
2024/11/28 9:50:15 973KB 西门子
使用于目前面部识别的测试用例,编写执行主要步骤比较合理,符符合大体流程,仅供参考
2024/11/28 9:04:21 20KB 面部识别
共 1000 条记录 首页 上一页 下一页 尾页