…首款篇章级中文手写字库…系统的样本采样机制…真实环境下的手写…广泛的应用支持未来的脱机手写汉字识别的研究对象必会从孤立工笔手写汉字逐渐过渡到真实手写中文语句。
脱机手写汉字识别领域亟需建立一个脱机手写中文文本库,用于支持面向真实手写环境的汉字识别研究。
为此,我们提出了面向真实手写环境的基于无切分策略的脱机手写汉字识别。
我们经过三年的系统工作,建立了一个包含约20万字的HIT-MW中文手写文本库(英文全称为HarbinInstituteofTechnology-MultipleWritersDatabase,中文名称为哈尔滨工业大学多人手写库,缩写为HIT-MW库),用于研究上述问题(具体情况见下文)。
由于采取了系统的采样方案,库中包含了很多真实手写现象,不仅有歪斜的(skewed)文本行,还有交叠(overlapping)和粘连(touching)文本行;
除了抄写错误(miswriting),还有涂改文字(erasure)的存在。
这样,脱机手写汉字识别从理想化的“单字”识别进入到面向真实手写环境的“文本”识别(或语句识别)的更高层次。
2024/7/7 15:17:50 1.26MB HIT-MW 汉字识别
1
网上一些资源下载不便,我最近也在搜集这方面资料,大家可以借鉴一下
2024/2/7 16:24:24 37B 文本识别
1
文本识别数据集:ICDAR2013训练集848张测试集1095标签中都是每张图片上对应的单词train.txt和test.txt都是过滤之后的标签(去掉符号和小于3个字符的)另外两个标签是原版标签没有进行任何过滤可自行在前面添加文件路径,也可以去我的主页下载添加路径的代码文件(python文件)
2023/11/18 10:34:36 194.98MB ICDAR2013 深度学习 文本识别 数据集
1
验证码识别,文本识别收集-CRNN(CNN+GRU/LSTM+CTC),含部份数据集请怪异博客https://blog.csdn.net/okfu_DL/article/details/90379583使用
2023/3/28 0:41:18 32.85MB 验证码识别
1
AttentionMechanism注意力机制引见,文本识别、语音识别、机器翻译
2023/3/17 0:50:14 1.91MB Slide
1
此demo程序包含QT调用opencv对图像进行灰度处理、二值化、形状学操作、腐蚀、膨胀等处理获取识别区域,扔给OCR进行文本识别。
2017/5/13 7:45:04 33.79MB OCR opencv QT
1
在日常工作中,钉钉打卡成了我生活中不可或缺的一部分。然而,有时候这个看似简单的任务却给我带来了不少烦恼。 每天早晚,我总是得牢记打开钉钉应用,点击"工作台",再找到"考勤打卡"进行签到。有时候因为工作忙碌,会忘记打卡,导致考勤异常,影响当月的工作评价。而且,由于我使用的是苹果手机,有时候系统更新后,钉钉的某些功能会出现异常,使得打卡变得更加麻烦。 另外,我的家人使用的是安卓手机,他们也经常抱怨钉钉打卡的繁琐。尤其是对于那些不太熟悉手机操作的长辈来说,每次打卡都是一次挑战。他们总是担心自己会操作失误,导致打卡失败。 为了解决这些烦恼,我开始思考是否可以通过编写一个全自动化脚本来实现钉钉打卡。经过一段时间的摸索和学习,我终于成功编写出了一个适用于苹果和安卓系统的钉钉打卡脚本。
2024-04-09 15:03 15KB 钉钉 钉钉打卡