文本对比工具,可以较好的对比2个文本的相似度,已经快速找出不同之处
2024/3/27 14:12:11 4.97MB 文本 对比 查重
1
跨语言文本相似度计算是挖掘蒙汉可比语料的基础和关键,其结果直接影响了可比语料的质量。
本文通过分析新闻文本特点,提出了一种融合多特征的跨语言新闻文本相似度计算方法。
该方法首先抽取新闻的发布日期、标题及正文信息作为特征,再利用双语文档发布日期的差异、正文长度关系、正文阿拉伯数字相似度、标题重合程度及正文重合程度五种启发信息进行加权线性组合来判断相似程度。
实验表明,本文提出的方法能明显提高蒙汉新闻文本相似度计算的准确率。
1
有源码及数据集,资源描述:基于TextRank、TF-IDF、LSI、LDA模型的关键词提取,实验数据为人民网的新闻,计算不同模型提取出的关键字的相似度
1
处理中文地址的分词和匹配采用混合分词算法进行中文地址分词在中文地址分词基础上采用DoubleLevenshetin算法进行中文地址相似度进行地址匹配
2024/3/10 11:23:57 18.08MB 中文地址 地址分词 地址匹配 Levenshtein
1
PESQ是客观评价通信中语音质量的方法,输入原始音频和在信道中传输的音频(内容相同,也成劣化音频),要求8K或16K编码格式,电平、时间对其,处理后得到两者相似度的评分,MOS得分,0-5分,分值越高,说明语音质量越好。
2024/2/28 5:55:14 254KB 音频 音频质量比较
1
Python编写的双2D,2DPCA,算法使用库函数的LBP,直方图算法余弦相似度,https://blog.csdn.net/u012505617/article/details/89191158feret人脸库,200人,每人7张;
看到大家需要,我就上传了。
代码都是我整理的,编写通过的。
Oracle数据库之前上传过
2024/2/27 20:17:32 10.49MB LBP 直方图 余弦相似度 feret人脸库
1
包含jws所需的jar包edu.mit.jwi和edu.sussex.nlp.jws.beta.11以及基于JWS写的词语相似度比较算法和JWS相关的帮助文档
2024/2/19 11:57:48 298KB jws jar包 相似度比较
1
这是一个VC毕业设计,全景图拼接算法实战源码+论文。
算法基本思想,图像A和B,A有至少1/3部分与B重合,在A中找图像块a,在B中找图像块b,利用夹角余弦距离,求a、b的相似度,利用循环使b在B中移动,找到相似度最大的图像块b。
通过b所在点坐标,确定B相对于A的偏移量。
通过偏移量将A和B放在同一坐标系实现拼接。
  有些情况下图像亮度相差较大,为减少亮度对拼接效果的影响,提高定位精度需对图像进行亮度调节。
主要方法有:直方图匹配和函数变换(类似于photoshop中的调整)。
此步处理也可放在图像放拼接后的图像处理
1
在推荐算法中,样本空间构成的数据矩阵一般为稀松矩阵,且维数一般较多,可通过求取特征值或者奇异值的方式获得样本矩阵的特征矩阵,从而降低维数。
主成分分析法在矩阵降维中有很好的应用。
本文通过特征值分解、奇异值分解、PCA等操作可以获得降维后的矩阵,通过使用不同的相似度判别法获得最好的相似度,可以使得推荐算法具有很好的效果。
2024/2/3 9:17:28 360KB 推荐系统 主成分分析
1
语义相似度任务-LCQMC数据集下载。
LCQMC是哈尔滨工业大学在自然语言处理国际顶会COLING2018构建的问题语义匹配数据集,其目标是判断两个问题的语义是否相同。
2024/1/30 13:24:57 6.35MB lcqmc 语义相似度
1
共 113 条记录 首页 上一页 下一页 尾页
在日常工作中,钉钉打卡成了我生活中不可或缺的一部分。然而,有时候这个看似简单的任务却给我带来了不少烦恼。 每天早晚,我总是得牢记打开钉钉应用,点击"工作台",再找到"考勤打卡"进行签到。有时候因为工作忙碌,会忘记打卡,导致考勤异常,影响当月的工作评价。而且,由于我使用的是苹果手机,有时候系统更新后,钉钉的某些功能会出现异常,使得打卡变得更加麻烦。 另外,我的家人使用的是安卓手机,他们也经常抱怨钉钉打卡的繁琐。尤其是对于那些不太熟悉手机操作的长辈来说,每次打卡都是一次挑战。他们总是担心自己会操作失误,导致打卡失败。 为了解决这些烦恼,我开始思考是否可以通过编写一个全自动化脚本来实现钉钉打卡。经过一段时间的摸索和学习,我终于成功编写出了一个适用于苹果和安卓系统的钉钉打卡脚本。
2024-04-09 15:03 15KB 钉钉 钉钉打卡