该资源主要参考我的博客:word2vec词向量训练及中文文本相似度计算http://blog.csdn.net/eastmount/article/details/50637476其中包括C语言的Word2vec源代码(从官网下载),自定义爬取的三大百科(百度百科、互动百科、维基百科)中文语料,涉及到国家、景区、动物和人物。
同时包括60M的腾讯新闻语料,是一个txt,每行相当于一个新闻。
国家包括了Python的Jieba分词代码,详见博客。
免费资源希望对你有所协助~
2023/1/16 9:44:47 142.09MB word2vec 源码 中文预料 词向量
1
现在论文抄袭、学术打假成为学术界、媒体关注的话题。
有的学者心存侥幸,有的学者对学术严谨性未加重视等,以至于被相关人士揭发举报,最终身败名裂。
而许多毕业生因为种种原因,并未对论文抄袭现象加以重视,最后不能顺利毕业,荒废了几年时间,得不偿失。
现在提供论文检测的机构主要来源于三大中文期刊数据库,即中国知网论文检测系统,万方论文相似性检测系统,维普通达检测系统。
现在应用较多的是中国知网和万方的检测系统,但是两者都不是免费的,其中,中国知网的费用相对高,在淘宝上一篇硕士论文的检测费用达到两百元。
介于此考虑,我在网上收集了一下,提供免费检测论文的几个网站。
虽然与权威检测机构的检测结果不一定完全一致,但肯定对论文的修改是有一定帮助的。
免费论文检测1PaperPass论文通行证网www.paperpass.org/index.aspx?f=A4BBA37525E99A492050231C7323CF76系统推出免费试用功能,通过您的手机号码即可申请。
申请成功后,您将免费获得3000字的检测量(每个手机限申请一次)。
注:由于服务器服务能力有限,网站每天(从零点计算)提供1000个用户申请免费试用,申请完为止,请您在每天的较早些时候申请,敬请谅解。
PaperPass.Org网站诞生于2007年,是全球首个中文文献相似度比对系统,运营三年来,已经发展成为最权威、最可信任的中文原创性检查和预防剽窃的在线网站。
目前在用检测版本是汲取了大量的用户意见后开发的,更新了比对算法,比对的效率和准确率大大提高,另外还增加了上传文件、下载报告、引用率统计等实用功能。
我们将继续贴近用户需求,升级比对算法,为用户提供更为专业的论文原创性检测服务。
2维普通达检测系统http://gocheck.cn/s/8059第一次成功充值之后即赠送第一次充值额度10%的积分,截止到4月1日,先注册先得哦。
维普-通达论文引用检测系统(简称VTTMS)是由重庆维普资讯有限公司与通达恒远(北京)信息技术有限公司共同研制而成,该系统结合了维普资讯的数据资源优势与通达的数据挖掘技术并成功地应用在大规模文本比对领域上的创新产品。
通过对文档关键语义片段的识别、检测,可检测出文档中存在的不当引用、过度以用,甚至是抄袭等现象,并计算出文档的引用率、复写率和自写率等重要指标,为各级论文评定、检测、发表机构提供论文评定和论文收录的检测依据。
该系统采用TONDA公司自主研发的核心算法技术,具有业内领先的检测速度。
全文比对数据库由专业的期刊数据库、广泛的web互联网数据、TONDA共享数据库和用户自建库组成,保证了比对源的专业性和广泛性。
VTTMS具备很高的实用性和易用性,自其成功研发以来,已经在全国范围内众多行业和部门得到了广泛使用,获得了高度的好评,取得了良好的口碑。
3知识产权卫士-拷克网http://www.copycheck.com.cn拷克网成立于2009年,是专业的内容抄袭智能检测平台服务商,成立以来一直执行“技术领先战略”,开创了具有国际领先水平的核心、高端、基础技术---互联网在线中文智能抄袭检测技术,作为一家拥有领先技术的服务商,我们致力于通过对技术的创新和应用,来满知识版权组织和个人的需要。
公司的技术核心是内容抄袭智能检测技术研究,以分词技术为基础,以结构智能方法论为指导,开发出文本语义结构化引擎、版式语义结构化引擎、行为语义分析引擎,由此构建了互联网内容抄袭智能检测服务平台。
该服务平台主要提供:网站监控、数据萃取、信息标引、情报发现与分析、知识网络、行为语义分析等在线服务。
4论文检测大师http://www.check-paper.com/只支持doc类型文件上传!提交您的有效论文,请不要上传无用文档,每个IP仅有2次检测机会,您的检测结果将以word文档的方式发送到您的邮箱里。
5中国搜文章照妖镜http://www.zhongguosou.com/文章照妖镜不但可用来分析文章抄袭的程度,而且可用来检测自己的博客文章被别人复制、被别人疯狂传播的程度,帮你保护你博客的版权。
6外文论文检测系统www.turnitin.com必杀招:智慧语料库技术+GradeMark™+专利的PeerReview,在全世界90多个国家、超过7000所高等院校应用,每天检测10万篇论文。
适用:英文论文抄袭检查http://www.dustball.com/7繁体论文检查网站:网址:http://www.ppvs.org网址:http://www.paper119.com/
1
FasterR-CNN+粒子群优化+图像配准首先利用深度学习FasterR-CNN,在训练好训练集的情况下检测和提取当前帧中的目标,利用5.1节的动目标提取算法校验目标;
然后以此作为接下来配准的模板,利用多自由度的图像配准来求解图像变换参数,并结合粒子群优化PSO的快速求解功能[20],高速的配准定位、跟踪与提取目标,将算法处理速度提升到了每秒60帧以上(配准时的速度)。
在配准过程中,如果出现配准相似度低于设定阈值,则认为目标跟踪失败,此时将重新利用FasterR-CNN检测与提取新目标,并重复过程。
2016/7/19 20:38:15 3KB 粒子群 Faster-RCNN PSO 相机抖动
1
主要功能记录行走的步数,行走的时间根据录入的体重,步长可以计算出每天行走的历程,消耗的热量对每天行走的历程进行记录,并给出星级评价软件原理判断人能否处于行走中,主要从以下几个方面判断:人如果走起来了,一般会连续多走几步。
因此,如果没有连续4-5个波动,那么就极大可能是干扰。
人走动的波动,比坐车产生的波动要大,因此可以看波峰波谷的高度,只检测高于某个高度的波峰波谷。
人的反射神经决定了人快速动的极限,怎么都不可能两步之间小于0.2秒,因此间隔小于0.2秒的波峰波谷直接跳过通过重力加速计感应,重力变化的方向,大小。
与正常走路或跑步时的重力变化比对,达到一定相似度时认为是在走路或跑步。
实现起来很简单,只要手机有重力感应器就能实现。
软件记步数的精准度跟用户的补偿以及体重有关,也跟用户设置的传感器的灵敏度有关系,在设置页面可以对相应的参数进行调节。
一旦调节结束,可以重新开始。
手机QQ早就加入了计算步幅功能,还能和好友PK“炫步”。
本项目可以作为一个独立的模块放到合适的项目里面。
2018/4/25 2:06:04 3.34MB android源码
1
【插件特色】1.文字识别领域,目前插件界,识别速度和准确率No.17000汉字,全屏识别,只需要几百毫秒,功能强劲!2.后台键鼠方面,目前插件界功能最齐全,最强悍的后台键鼠3.图色方面,高速找图找色,取色4.支持MASMCall代码嵌入执行【功能特点】文字识别方面1.所有文字识别接口都支持后台gdi后台gdi2后台dx后台dx2后台dx3以及前台normal2.支持RGBHSV颜色识别3.支持RGBHSV差色识别4.支持多种颜色混合识别(最多10种)5.支持连体字识别6.支持背景色识别7.支持点阵模糊识别(防杂点干扰)8.支持查找指定字符串在屏幕的坐标9.支持查找指定字符串在屏幕上的所有坐标10.支持在未知文字的情况下进行词组识别11.支持在没有字库的情况下,进行词组范围识别12.支持多字库,最多10个字库。
方便针对不同的情况制作字库.13.完全兼容91OCR字库(txt字库,mdb不支持)14.支持字库自定义加密解密15.支持识别指定图片中的文字16.支持在代码中添加字库图色方面1.所有图色接口都支持后台gdi后台gdi2后台dx后台dx2后台dx3以及前台normal2.支持颜色查找,多种颜色查找,并可指定搜索的方向以及相似度3.支持图形查找,多个图形查找,并可指定搜索的方向以及相似度4.支持直接获取某点的颜色(RGB,HSV)5.支持直接对某点的颜色进行比较,可指定相似度6.可直接对任意区域进行截图,并保存为bmp(24位色)7.可获取某范围的RGB和HSV颜色均值8.支持图片透明色9.支持多图查找10.支持直接获取图像数组,方便二次开发11.支持多点找色键鼠方面1.所有键鼠接口都支持windows消息模拟,dx以及前台2.前台完全模拟,功能和按键自带的完全一样3.后台windows消息模拟(类似于按键自带的后台键鼠)4.dx键盘几乎支持所有游戏后台组合键.(首创)5.后台dx(首创,支持大型的3D以及2D游戏键鼠的模拟)后台方面1.两个函数,搞定前后台的切换,非常简单快捷.窗口方面1.支持任意绘制的信息提示窗口,可以随着游戏窗口的移动而移动2.信息提示窗口可以鼠标拖动,更加方便快捷3.支持获取通过正常手段获取不到的窗口句柄,比如QQ系列游戏4.支持枚举窗口5.支持获取窗口各种状态6.支持对窗口进行各种操作,关闭,最小化等等内存方面1.支持CE格式的内存读取2.支持各种数据类型的搜索,以及多次搜索(类似CE)3.强力内存接口,按键自带的读不到,可以试试这个4.强力的内存写接口(简单游版本不支持)汇编方面(简单游版本不支持)1.支持MASM语法的汇编语句,支持本进程以及目标进程的汇编代码嵌入执行(俗语Call)2.支持机器码和MASM语句的互转答题器1.支持前后台的截图发送到服务端2.支持前后台的截取动画发送到服务端【颜色格式】1.RGB模式RRGGBB-偏色RR偏色GG偏色BB适用于颜色偏差较大的场合2.HSV模式H.S.V-偏色H.偏色S.偏色V适用于颜色接近的场合例如,RGB模式:9f2e3f-000000表示颜色为9f2e3f,RGB的偏色都为09f2e3f-020202表示颜色为9f2e3f,RGB的偏色都为02HSV模式:20.30.20-0.0.0表示颜色为20.30.20,HSV的偏色都为020.30.20-0.0.20表示颜色为20.30.20,HSV的偏色为0020
2019/4/24 7:15:47 2.53MB 大漠 插件 1233 免费
1
【插件特色】1.文字识别领域,目前插件界,识别速度和准确率No.17000汉字,全屏识别,只需要几百毫秒,功能强劲!2.后台键鼠方面,目前插件界功能最齐全,最强悍的后台键鼠3.图色方面,高速找图找色,取色4.支持MASMCall代码嵌入执行【功能特点】文字识别方面1.所有文字识别接口都支持后台gdi后台gdi2后台dx后台dx2后台dx3以及前台normal2.支持RGBHSV颜色识别3.支持RGBHSV差色识别4.支持多种颜色混合识别(最多10种)5.支持连体字识别6.支持背景色识别7.支持点阵模糊识别(防杂点干扰)8.支持查找指定字符串在屏幕的坐标9.支持查找指定字符串在屏幕上的所有坐标10.支持在未知文字的情况下进行词组识别11.支持在没有字库的情况下,进行词组范围识别12.支持多字库,最多10个字库。
方便针对不同的情况制作字库.13.完全兼容91OCR字库(txt字库,mdb不支持)14.支持字库自定义加密解密15.支持识别指定图片中的文字16.支持在代码中添加字库图色方面1.所有图色接口都支持后台gdi后台gdi2后台dx后台dx2后台dx3以及前台normal2.支持颜色查找,多种颜色查找,并可指定搜索的方向以及相似度3.支持图形查找,多个图形查找,并可指定搜索的方向以及相似度4.支持直接获取某点的颜色(RGB,HSV)5.支持直接对某点的颜色进行比较,可指定相似度6.可直接对任意区域进行截图,并保存为bmp(24位色)7.可获取某范围的RGB和HSV颜色均值8.支持图片透明色9.支持多图查找10.支持直接获取图像数组,方便二次开发11.支持多点找色键鼠方面1.所有键鼠接口都支持windows消息模拟,dx以及前台2.前台完全模拟,功能和按键自带的完全一样3.后台windows消息模拟(类似于按键自带的后台键鼠)4.dx键盘几乎支持所有游戏后台组合键.(首创)5.后台dx(首创,支持大型的3D以及2D游戏键鼠的模拟)后台方面1.两个函数,搞定前后台的切换,非常简单快捷.窗口方面1.支持任意绘制的信息提示窗口,可以随着游戏窗口的移动而移动2.信息提示窗口可以鼠标拖动,更加方便快捷3.支持获取通过正常手段获取不到的窗口句柄,比如QQ系列游戏4.支持枚举窗口5.支持获取窗口各种状态6.支持对窗口进行各种操作,关闭,最小化等等内存方面1.支持CE格式的内存读取2.支持各种数据类型的搜索,以及多次搜索(类似CE)3.强力内存接口,按键自带的读不到,可以试试这个4.强力的内存写接口(简单游版本不支持)汇编方面(简单游版本不支持)1.支持MASM语法的汇编语句,支持本进程以及目标进程的汇编代码嵌入执行(俗语Call)2.支持机器码和MASM语句的互转答题器1.支持前后台的截图发送到服务端2.支持前后台的截取动画发送到服务端【颜色格式】1.RGB模式RRGGBB-偏色RR偏色GG偏色BB适用于颜色偏差较大的场合2.HSV模式H.S.V-偏色H.偏色S.偏色V适用于颜色接近的场合例如,RGB模式:9f2e3f-000000表示颜色为9f2e3f,RGB的偏色都为09f2e3f-020202表示颜色为9f2e3f,RGB的偏色都为02HSV模式:20.30.20-0.0.0表示颜色为20.30.20,HSV的偏色都为020.30.20-0.0.20表示颜色为20.30.20,HSV的偏色为0020
2019/4/24 7:15:47 2.53MB 大漠 插件 1233 免费
1
可以做图像分割,数据挖掘,目前,针对K-Means算法研究及应用,尤其是在文本聚类挖掘层面的应用研究越来越多。
K-means算法是很典型的基于距离的聚类算法,采用距离作为相似性的评价指标,即认为两个对象的距离越近,其相似度就越大。
该算法认为簇是由距离靠近的对象组成的,因而把得到紧凑且独立的簇作为最终目标。
2015/5/23 20:02:13 3KB 基于 遗传 算法 聚类
1
最近做了一些多目标跟踪方向的调研,因此把调研的结果以图片加文字的方式展现出来,希望能帮助到入门这一领域的同学。
也欢迎大家和我讨论关于这一领域的任何问题。
这些是我所了解的多目标跟踪(MOT)的一些相关方向。
其中单目标跟踪(VOT/SOT)、目标检测(detection)、行人重识别(Re-ID)都是非常热门的方向。
而偏视频的相关方向就比较冷门。
而且今年五月DukeMTMC因为隐私问题不再提供MTMCT的数据了,MTMCT的研究也是举步维艰。
因此绝大多数MOT算法无外乎就这四个步骤:①检测②特征提取、运动预测③相似度计算④数据关联。
其中影响最大的部分在于检测,检测结果的好坏对于最后指标的影响是最大
2016/9/1 23:18:22 1.18MB 多目标跟踪(MOT)入门
1
通过比较两张人脸相似度判断能否是同一个人,博客说明:http://blog.csdn.net/zhong1113/article/details/25332893
2019/1/10 6:53:33 2.1MB face++ 人脸识别 验证
1
特征脸方法是从主成分分析(PCA)导出的一种人脸识别和描述技术。
它将包含人脸的图像区域看作一随机向量,采用K-L变换得到正交K-L基,对应其中较大特征值的基具有与人脸相似的形状,因而又被称为特征脸。
利用这些基的线性组合可以描述、表达和逼近人脸图像,所以可进行人脸识别与合成。
识别过程就是将人脸图像映射到由特征脸组成的子空间上,并比较其在特征脸空间中的位置,然后利用对图像的这种投影间的某种度量来确定图像间的相似度,最常见的就是选择各种距离函数来进行度量分类实现人脸识别。
2015/9/9 18:58:16 2.55MB 数学建模
1
在日常工作中,钉钉打卡成了我生活中不可或缺的一部分。然而,有时候这个看似简单的任务却给我带来了不少烦恼。 每天早晚,我总是得牢记打开钉钉应用,点击"工作台",再找到"考勤打卡"进行签到。有时候因为工作忙碌,会忘记打卡,导致考勤异常,影响当月的工作评价。而且,由于我使用的是苹果手机,有时候系统更新后,钉钉的某些功能会出现异常,使得打卡变得更加麻烦。 另外,我的家人使用的是安卓手机,他们也经常抱怨钉钉打卡的繁琐。尤其是对于那些不太熟悉手机操作的长辈来说,每次打卡都是一次挑战。他们总是担心自己会操作失误,导致打卡失败。 为了解决这些烦恼,我开始思考是否可以通过编写一个全自动化脚本来实现钉钉打卡。经过一段时间的摸索和学习,我终于成功编写出了一个适用于苹果和安卓系统的钉钉打卡脚本。
2024-04-09 15:03 15KB 钉钉 钉钉打卡