基于文本内容的自动文本聚类技术作为文本信息挖掘技术中的核心技术之一,其目标是将文档集合分成若干个簇,要求同一簇内文档内容的相似度尽可能的大,而不同簇之间的相似度尽可能的小。
本文以中文文本作为文本聚类的挖掘对象,对文本集进行了中文文本预处理、文本聚类。
按照文中的方法步骤,设计了一个系统,实现了文本聚类的功能。
1
采用动态规划思想,根据最优子结构性质,求出对比代码的最长公共子序列,从而判断对比代码的相似度。
本系统把分词技术和最长公共子序列有机的结合,将对比代码分割成单词或标点符号,以单词和符号为检测单元,有效的提高了检测的精准度
2025/4/30 15:14:58 4.8MB JAVA 重复率检测 相似度 源程序文件
1
SAD(Sumofabsolutedifferences)是一种图像匹配算法。
基本思想:差的绝对值之和。
此算法常用于图像块匹配,将每个像素对应数值之差的绝对值求和,据此评估两个图像块的相似度。
该算法快速、但并不精确,通常用于多级处理的初步筛选。
2025/4/21 22:19:30 714KB 图像匹配算
1
java实现的文本相似度系统,使用向量空间模型以及余弦相似度距离公式,实测可以实现2篇文本的相似度计算且有一定的效果。
2025/4/17 16:06:49 46.37MB 文本相似度
1
Matlab余弦相似度算法判断图片相似度并识别源代码Matlab余弦相似度图像匹配可直接运行
1
.版本2.子程序窗口_截图,字节集,公开,截取指定窗口的位图,可截取窗口中指定区域,最小化窗口或不可见窗口无法截取位图.参数窗口句柄,整数型,,欲截取窗口图片的窗口句柄.参数左边,整数型,可空,默认为0在窗口中截取图片的左边(相对于窗口的左边偏移坐标).参数顶边,整数型,可空,默认为0在窗口中截取图片的顶边(相对于窗口的顶边偏移坐标).参数宽度,整数型,可空,在窗口中截取图片的宽度(若为空,则截取整个窗口位图).参数高度,整数型,可空,在窗口中截取图片的高度(若为空,则截取整个窗口位图).子程序窗口_判断色彩度相同数,逻辑型,公开,满足最低相同数目返回真,否则返回假.参数窗口句柄,整数型,,指定的窗口句柄(对于最小化窗口或不可见窗口无效).参数色,整数型,,欲判断的颜色色彩度(色彩度:0-255).参数最低,整数型,,最低相同的数目.参数左下角,识图_坐标,可空,判断范围的左下角坐标,默认为0.参数宽度,整数型,,向右的范围宽度.参数高度,整数型,,向上的范围高度.参数返回相同数,整数型,参考可空.子程序窗口_取颜色,整数型,公开,取出窗口中指定点的颜色值(返回十进制颜色值,失败返回-1).参数窗口句柄,整数型,,欲取颜色值所在窗口的句柄.参数坐标X,整数型,,欲取的颜色值在窗口中的横坐标.参数坐标Y,整数型,,欲取的颜色值在窗口中的纵坐标.子程序窗口_取颜色数,整数型,公开,取出窗口中指定范围内某种颜色的数目,失败返回-1,未找到返回0.参数窗口句柄,整数型,,指定的窗口句柄(对于最小化窗口或不可见窗口无效).参数颜色,整数型,,欲判断的十进制颜色.参数左边,整数型,可空,范围左边,默认为0.参数顶边,整数型,可空,范围顶边,默认为0.参数宽度,整数型,,范围矩形宽度.参数高度,整数型,,范围矩形高度.参数相似度,整数型,可空,可空:无误差(0-255)RGB误差值无误差是带误差效率一半.子程序窗口_取最多色,整数型,公开,取出窗口中指定范围内最多的一种颜色值,返回十进制颜色值,失败返回-1.参数窗口句柄,整数型,,指定的窗口句柄(对于最小化窗口或不可见窗口无效).参数左边,整数型,可空,范围左边,默认为0.参数顶边,整数型,可空,范围顶边,默认为0.参数宽度,整数型,,范围矩形宽度.参数高度,整数型,,范围矩形高度.参数数目,整数型,参考可空,返回该颜色的数目.子程序窗口_找色彩,识图_坐标,公开,在窗口中指定范围内查找符合条件的色彩度,返回第一个符合条件的坐标(失败或未找到返回-1坐标).参数窗口句柄,整数型,,指定的窗口句柄(对于最小化窗口或不可见窗口无效).参数色彩度低,整数型,,欲寻找色彩度范围-低位(色彩度:0-255).参数色彩度高,整数型,,欲寻找色彩度范围-高位(色彩度:0-255).参数左边,整数型,可空,寻找范围-矩形左边,默认为0.参数顶边,整数型,可空,寻找范围-矩形顶边,默认为0.参数宽度,整数型,,寻找范围-矩形宽度.参数高度,整数型,,寻找范围-矩形高度
2025/3/28 20:14:25 119KB 识图模块
1
在网上找的用灰度直方图方法计算相似度的算法写的小例子,经测试效果还可以在网上找的用灰度直方图方法计算相似度的算法写的小例子,经测试效果还可以
2025/3/22 20:28:39 79KB c# 图片相似度
1
python爬虫,以及相似度分析,可以分析两个文本字符串的相似度
2025/3/18 16:03:54 29KB python 爬虫 相似度分析
1
基于内容的图像检索是计算机视觉的一个重要课题,它包括基于颜色、基于纹理、基于形状的图像检索,其中,今天我们讨论的是相对简单的基于颜色的图像检索。
我们知道,直方图是标识图像内容的一种有效方式,因此这里关键是要做到,仅仅比较它们的直方图就能测量出两个图像的相似度。
需要定义一个测量函数来评估两个直方图之间的差异程度或者相似
2025/3/15 8:47:38 18KB 图像检索
1
在文本聚类中需要衡量中文文本之间的相似性。
本文首先讨论了文本相似度的概念和常用计算算法,详细介绍了向量空间模型和算法步骤,采用删除去除词表、近义词合并、修改文件长度3中策略对算法进行了改进。
最后借助盘古分词组件和搜狗实验室的互联网词库,在VisualStudio2008环境下使用C#语言对算法进行了实现。
使用在CNKI上得到的5个不同领域的500篇学术论文的中文摘要对算法进行了测试,结果表明新算法在误差率方面有较大改善,但运行时间较长。
1
共 105 条记录 首页 上一页 下一页 尾页
在日常工作中,钉钉打卡成了我生活中不可或缺的一部分。然而,有时候这个看似简单的任务却给我带来了不少烦恼。 每天早晚,我总是得牢记打开钉钉应用,点击"工作台",再找到"考勤打卡"进行签到。有时候因为工作忙碌,会忘记打卡,导致考勤异常,影响当月的工作评价。而且,由于我使用的是苹果手机,有时候系统更新后,钉钉的某些功能会出现异常,使得打卡变得更加麻烦。 另外,我的家人使用的是安卓手机,他们也经常抱怨钉钉打卡的繁琐。尤其是对于那些不太熟悉手机操作的长辈来说,每次打卡都是一次挑战。他们总是担心自己会操作失误,导致打卡失败。 为了解决这些烦恼,我开始思考是否可以通过编写一个全自动化脚本来实现钉钉打卡。经过一段时间的摸索和学习,我终于成功编写出了一个适用于苹果和安卓系统的钉钉打卡脚本。
2024-04-09 15:03 15KB 钉钉 钉钉打卡