授课对象:这是一门数学课程,适合有志于转往大数据分析领域的非数学专业人士(例如IT人,业务人员等)补强数学基础,以更好地学习更高级的数据分析,数据挖掘,机器学习课程收获预期:可以大幅度提高学员的数学基础,使其学习其它大数据分析课程时觉得更加简单,得心应手课程内容:第1课面向小白的统计学:描述性统计(均值,中位数,众数,方差,标准差,与常见的统计图表)第2课赌博设计:概率的基本概念,古典概型第3课每人脑袋里有个贝叶斯:条件概率与贝叶斯公式,独立性第4课啊!微积分:随机变量及其分布(二项分布,均匀分布,正态分布)&J.e3P:w6X2^;K*W1U&X第5课万事皆由分布掌握:多维随机变量及其分布4o7|%v%n9\"m4R)|第5课砖家的统计学:随机变量的期望,方差与协方差"s4@+n.v"I:V)`-u第6课上帝之手,统计学的哲学基础:大数定律、中心极限定理与抽样分布+j:W+V/n1_4Y)`/w+[第8课点数成金,从抽样推测规律之一:参数估计之点估计$v3^1V.H(t,G9b:U第9课点数成金,从抽样推测规律之二:参数估计之区间估计第10课对或错?告别拍脑袋决策:基于正态总体的假设检验第11课扔掉正态分布:秩和检验!s!G1w#i3P*]#e第12课预测未来的技术:回归分析,O%b!U)k4h#]$p第13课抓住表象背后那只手:方差分析第14课沿着时间轴前进,预测电子商务业绩:时间序列分析简介,X.n%b4~8PE9\+d第15课PageRank的背后:随机过程与马尔科夫链简介
2025/7/23 6:41:21 61B 大数据
1
这篇论文主要探讨了中国古代玻璃制品的风化模型,利用随机森林算法进行数据分析和预测。
文章在数学建模的背景下,获得了山西省一等奖,论文的核心技术包括随机森林优化、数据填充、特征选择、降维模型和分类算法的应用。
对于问题一,研究者处理了数据中的缺失值,使用众数来填充颜色数据。
通过交叉表和卡方检验,确定了表面风化与玻璃类型之间有强相关性,与纹饰有弱相关性,与颜色则无明显关联。
通过观察化学成分的分布,如氧化铅和氧化钾含量,发现不同类型的玻璃具有特定的成分特征。
然后,他们构建了随机森林模型,以风化前后的均值偏差率预测化学成分含量,并验证了预测的准确性。
针对问题二,论文建立了基于重采样的随机森林模型来识别高钾玻璃和铅钡玻璃的分类规律。
通过对14个化学成分的分析,确定了二氧化硅、氧化钾、氧化铅和氧化钡作为关键因素。
通过投影寻踪法降低维度至5个重要成分,并利用改进的k-means聚类算法,将样本分为3个亚类,结果与实际相符。
通过调整聚类数优化损失函数,验证了初始设定的合理性。
在问题三中,研究者加入了有无风化的指标,继续使用随机森林模型预测玻璃类型,测试集预测准确率达到100%。
同时,通过支持向量机(SVM)和贝叶斯判别法结合扰动项,验证了有无风化指标对分类结果的影响,结果显示这个指标的作用不大。
此外,通过正态扰动测试随机森林模型的敏感性,证明模型的稳定性。
对于问题四,论文建立逐步回归模型,寻找不同类别化学成分间的线性关联。
通过VIF方差膨胀因子分析,确定了两类玻璃在二氧化硅、氧化钾、氧化铅和氧化钡等成分上的显著差异性,这与之前的问题二分析结果一致。
总结来说,这篇论文在数学建模的框架下,利用随机森林算法解决了古代玻璃制品风化的建模问题,包括了数据预处理、分类模型建立、特征重要性分析、降维聚类和线性关联研究等多个方面。
这些方法不仅在解决本问题上取得了良好效果,也为类似的历史文物研究提供了有价值的分析工具和思路。
2024/9/2 15:54:31 2.45MB 数学建模 随机森林
1
标准化降水指数(SPI)是一种应用广泛的气象干旱指数,是表征某时段降水量出现的概率多少的指标,适合于月以上时间尺度的干旱监测与评估。
由于SPI采用函数的标准化降水累积频率分布来描述降水量的变化,因此其值在不同地区和不同时间段之间具有可比性[22]。
在计算标准化降水指数时,先将偏态概率分布的降水量进行正态标准化处理,再用标准化降水累积频率分布来划分干旱等级,计算方法可参照气象干旱国家标准。
2024/7/16 7:21:26 19KB 气象
1
《概率论与数理统计:英文本》简介:  本书从ThomsonLearning出版公司引进。
本书主要介绍了概率统计的基本思想、概念和方法,从各个应用层面和案例入手,使用尽量少的概率知识介绍了应用统计的基本内容和扩展内容。
阅读本书,不需要微积分学知识,只需具备高中数学水平即可。
本书着重思维、层次分明、大量案例与练习以统计软件Minitab作统计分析,使用方便,适合于工科、经济、管理类专业学生作为概率统计双语教材使用,也可供教师教学参考。
本书主要内容有:0.统计学简介;
1.用图表描述数据;
2.用数值方法描述数据;
3.双变量数据的描述;
4.概率及概率分布;
5.几个有用的离散型分布;
6.正态概率分布;
7.抽样分布;
8.大样本估计;
9.大样本假设检验;
10.从小样本推断;
11.方差分析;
12.线性回归及相关性;
13.多元线性回归;
14.范畴数据分析;
15.非参数统计。
2024/6/2 18:52:11 1.96MB keytoexercis
1
matlab二维正态概率密度二维概率分布
2024/6/1 14:52:15 483B matlab 二维 正态 概率密度
1
无线信道的路径损耗模型的仿真,具体为自由空间的损耗和正态阴影路径损耗模型
2024/5/8 1:05:28 2KB MATLAB仿真
1
第1章绪论1.1什么叫数理统计学1.2数理统计的若干基本概念1.3统计量习题一第2章抽样分布及若干预备知识2.1引言2.2正态总体样本均值和样本方差的分布*2.3次序统计量的分布2.4X2分布,t分布和F分布2.5统计量的极限分布*2.6指数族2.7充分统计量*2.8完全统计量习题二第3章点估计3.1引言3.2矩估计3.3极大似然估计*3.4一致最小方差无偏估计3.5Cramer-Rao不等式习题三第4章区间估计4.1区间估计的基本概念4.2枢轴变量法——正态总体参数的置信区间4.3枢轴变量法——非正态总体参数的置信区间4.4Fisher的信仰推断法4.5容忍区间与容忍限习题四第5章参数假设检验5.1假设检验的若干基本概念5.2正态总体参数的假设检验5.3假设检验与区间估计*5.4一致最优检验与无偏检验5.5似然比检验
2023/12/20 13:29:46 60.49MB 统计
1
在构建355,532,1064nm3个波长的后向散射效率因子与355nm和532nm两个波长的消光效率因子查算表的基础上,正演计算出气溶胶的3个波长的后向散射系数与两个波长的消光系数(3β和2α)。
通过非线性拟合,模拟反演了对数正态单峰分布情况下气溶胶的谱分布参数。
结果表明:该方法可以反演得到单峰分布的气溶胶谱分布参数,不同初始值对反演结果的影响较小;复折射指数对气溶胶谱分布的反演起重要作用,当复折射指数的实部和虚部分别具有±1步长范围内的不确定性时,反演得到的粒子数浓度、几何标准偏差和峰值半径3个参数的相对误差分别为20.32%、33.50%和24.72%,其中实部比虚部的误差贡献更大。
该研究为多波长激光雷达反演气溶胶谱分布垂直廓线的研究提供了理论基础。
2023/9/8 9:11:03 3.11MB 大气光学 气溶胶 谱分布 非线性拟
1
投影寻踪(projectionpursuit,PP)方法属于直接由样本数据驱动的探索性数据分析方法,是美国科学家Kruscal于20世纪70年代提出的,在高维性、非线性、非正态数据分析处理方面有独到之处,运用matlab编程,其计算步骤如下:(1)指标体系无量纲化;
(2)构造投影指标函数;
(3)构造投影目标函数;
(4)确定最佳投影方向;
(5)确定投影值
2023/8/3 15:48:08 15KB 投影寻踪法 pp matlab
1
本代码首要行使MATLAB货物实现MATLAB——建树尺度正态漫衍随机矩阵,约莫明晰,易于知道
2023/5/5 19:17:19 57B MATLAB 正态分布
1
共 23 条记录 首页 上一页 下一页 尾页
在日常工作中,钉钉打卡成了我生活中不可或缺的一部分。然而,有时候这个看似简单的任务却给我带来了不少烦恼。 每天早晚,我总是得牢记打开钉钉应用,点击"工作台",再找到"考勤打卡"进行签到。有时候因为工作忙碌,会忘记打卡,导致考勤异常,影响当月的工作评价。而且,由于我使用的是苹果手机,有时候系统更新后,钉钉的某些功能会出现异常,使得打卡变得更加麻烦。 另外,我的家人使用的是安卓手机,他们也经常抱怨钉钉打卡的繁琐。尤其是对于那些不太熟悉手机操作的长辈来说,每次打卡都是一次挑战。他们总是担心自己会操作失误,导致打卡失败。 为了解决这些烦恼,我开始思考是否可以通过编写一个全自动化脚本来实现钉钉打卡。经过一段时间的摸索和学习,我终于成功编写出了一个适用于苹果和安卓系统的钉钉打卡脚本。
2024-04-09 15:03 15KB 钉钉 钉钉打卡