课程作业,是对中文文本的获取、删除特殊符号、删除停用词、分词、最后计算文本之间的相似度、降维、Kmeans聚类以及可是化等
2024/9/25 1:35:57 12KB 文本预处理
1
基于k-means聚类分析房价问题(昆明房价)(源码+实验报告)。
其中包含爬虫、聚类分析、数据可视化等源码,以及实验报告。
采用python进行编程,对链家网资源进行爬取和分析
2024/9/22 13:42:05 2.07MB python 聚类分析 k-means 数据挖掘
1
这篇论文主要探讨了中国古代玻璃制品的风化模型,利用随机森林算法进行数据分析和预测。
文章在数学建模的背景下,获得了山西省一等奖,论文的核心技术包括随机森林优化、数据填充、特征选择、降维模型和分类算法的应用。
对于问题一,研究者处理了数据中的缺失值,使用众数来填充颜色数据。
通过交叉表和卡方检验,确定了表面风化与玻璃类型之间有强相关性,与纹饰有弱相关性,与颜色则无明显关联。
通过观察化学成分的分布,如氧化铅和氧化钾含量,发现不同类型的玻璃具有特定的成分特征。
然后,他们构建了随机森林模型,以风化前后的均值偏差率预测化学成分含量,并验证了预测的准确性。
针对问题二,论文建立了基于重采样的随机森林模型来识别高钾玻璃和铅钡玻璃的分类规律。
通过对14个化学成分的分析,确定了二氧化硅、氧化钾、氧化铅和氧化钡作为关键因素。
通过投影寻踪法降低维度至5个重要成分,并利用改进的k-means聚类算法,将样本分为3个亚类,结果与实际相符。
通过调整聚类数优化损失函数,验证了初始设定的合理性。
在问题三中,研究者加入了有无风化的指标,继续使用随机森林模型预测玻璃类型,测试集预测准确率达到100%。
同时,通过支持向量机(SVM)和贝叶斯判别法结合扰动项,验证了有无风化指标对分类结果的影响,结果显示这个指标的作用不大。
此外,通过正态扰动测试随机森林模型的敏感性,证明模型的稳定性。
对于问题四,论文建立逐步回归模型,寻找不同类别化学成分间的线性关联。
通过VIF方差膨胀因子分析,确定了两类玻璃在二氧化硅、氧化钾、氧化铅和氧化钡等成分上的显著差异性,这与之前的问题二分析结果一致。
总结来说,这篇论文在数学建模的框架下,利用随机森林算法解决了古代玻璃制品风化的建模问题,包括了数据预处理、分类模型建立、特征重要性分析、降维聚类和线性关联研究等多个方面。
这些方法不仅在解决本问题上取得了良好效果,也为类似的历史文物研究提供了有价值的分析工具和思路。
2024/9/2 15:54:31 2.45MB 数学建模 随机森林
1
1、掌握数据预处理的方法,对数据进行预处理;
2、掌握基本K-MEANS算法的使用;
2024/7/24 13:49:28 276KB K-MEANS聚类
1
K-means聚类算法c语言实现。
代码正确,有详细注释,欢迎下载参考!
2024/7/22 2:51:37 4KB kmeans,c
1
利用bow训练器进行k-means聚类,训练svm分类器进行车辆检测
2024/7/18 3:48:22 3KB 车辆检测
1
上述代码是利用python内置的k-means聚类算法对鸢尾花数据的聚类效果展示,注意在运行该代码时需要采用pip或者其他方式为自己的python安装sklearn以及iris扩展包,其中X=iris.data[:]表示我们采用了鸢尾花数据的四个特征进行聚类,如果仅仅采用后两个(效果最佳)则应该修改代码为X=iris.data[2:]
2024/5/9 17:25:35 727B python
1
提取手部轮廓特征,k-means聚类算法,训练得到手势识别模型,然后用测试数据测试。
2024/5/2 4:39:02 6.09MB 手势识别
1
这是k-means的MATLAB程序,主要用于各种数据的聚类等情况
2024/4/16 15:06:10 3KB 聚类
1
为实现自然条件下棉花叶片的精准分割,提出一种粒子群(Particle swarm optimization,PSO)优化算法和K-means聚类算法混合的棉花叶片图像分割方法。
本算法将棉花叶片图像在RGB颜色空间模式下采用二维卷积滤波进行去噪预处理,并将预处理后的彩色图像从RGB转换到目标与背景差异性最大的Q分量、超G分量、a*分量;
随后在K均值聚类的一维数据空间中,利用PSO算法向全局像素解的子空间搜寻,通过迭代搜寻得到全局最优解,确定最佳聚类中心点,改善K均值聚类的收敛效果;
最后,对像素进行聚类划分,从而得到棉花叶片分割结果。
按照不同天气条件和不同背景采集了1 200幅棉花叶片样本图像,对本研究算法进行测试。
试验结果表明:该算法对于晴天、阴天和雨天图像中目标(棉花叶片)分割准确率分别达到92.39%、93.55%、88.09%,总体平均分割精度为91.34%,并与传统K均值算法比较,总体平均分割精度提高了5.41%。
分割结果表明,本研究算法能够对3种天气条件(晴天、阴天、雨天)与4种复杂背景(白地膜、黑地膜、秸秆、土壤)特征混合的棉花叶片图像实现准确分割,为棉花叶片的特征提取与病虫害识别等后续处理提供支持。
2024/4/14 16:22:47 2.56MB pdf
1
共 44 条记录 首页 上一页 下一页 尾页
在日常工作中,钉钉打卡成了我生活中不可或缺的一部分。然而,有时候这个看似简单的任务却给我带来了不少烦恼。 每天早晚,我总是得牢记打开钉钉应用,点击"工作台",再找到"考勤打卡"进行签到。有时候因为工作忙碌,会忘记打卡,导致考勤异常,影响当月的工作评价。而且,由于我使用的是苹果手机,有时候系统更新后,钉钉的某些功能会出现异常,使得打卡变得更加麻烦。 另外,我的家人使用的是安卓手机,他们也经常抱怨钉钉打卡的繁琐。尤其是对于那些不太熟悉手机操作的长辈来说,每次打卡都是一次挑战。他们总是担心自己会操作失误,导致打卡失败。 为了解决这些烦恼,我开始思考是否可以通过编写一个全自动化脚本来实现钉钉打卡。经过一段时间的摸索和学习,我终于成功编写出了一个适用于苹果和安卓系统的钉钉打卡脚本。
2024-04-09 15:03 15KB 钉钉 钉钉打卡