建模分析师(数据分析师、数据挖掘工程师)理论基础:统计学、概率论、数理统计、多元统计分析、时间序列、数据挖掘(DM)软件要求:Excel、SQL(必要)&SPSSModeler、R、Python、SAS、Weka等(可选)分析方法要求:除掌握基本数据处理及分析方法以外,还应掌握高级数据分析及数据挖掘方法(多元线性回归法、生存分析法、神经网路、决策树、判别分析法、主成分分析法、因子分析法、典型相关分析、聚类分析法、关联规则、支持向量机、bagging、boosting等)和可视化技术。
业务分析能力:可以将业务目标转化为数据分析目标熟悉常用算法和数据结构,熟悉企业数据库架构建设针对不同分析主体,可以熟练的进行维度分析,能够从海量数据中搜集并提取信息通过相关数据分析方法,结合一个或多个数据分析软件完成对海量数据的处理和分析结果展现能力:报告体现数据挖掘的整体流程,层层阐述信息的收集、模型的构建、结果的验证和解读,对行业进行评估,优化和决策。
1
用fisher线性判别分析建立P300分类模型。
特征提取用PCA。
2023/6/15 6:41:42 8KB fisher P300 LDA PCA
1
kaggle比赛Titanic的R教程一和三(决策树、随机森林和logistics模型);
利用薛毅《统计建模与R软件》书中判别分析章节中的距离判别、贝叶斯判别和Fisher判别函数实习的模型预测
2023/3/18 0:20:50 8KB 判别分析
1
基于matlab的各种多元统计分析模型源代码-空调负荷神经网络预测airconditionforcasting.rar本人为了获得更多资源共享的权限,只好吐血奉献自己一年来收集和改写的matlab源程序,部分为原创;
里面包含有主成分分析、岭回归分析、因子分析、判别分析、聚类分析、回归分析等;
绝对可用哦,不过,还是得提醒一下,由于不断是自己使用,里面没有更多注释,希望没有这方面知识基础的朋友慎重下载哪,免得浪费精力撒。
    希望大家多多支持,给予评论。
2023/2/12 3:19:30 447B matlab
1
随机森林randomforest模型是由Breiman和Cutler在2001年提出的一种基于分类树的算法它通过对大量分类树的汇总提高了模型的预测精度是取代神经网络等传统机器学习方法的新的模型随机森林的运算速度很快在处理大数据时表现优良随机森林不需要顾虑一般回归分析面临的多元共线性的问题不用做变量选择现有的随机森林软件包给出了所有变量的重要性另外随机森林便于计算变量的非线性作用而且可以体现变量间的交互作用interaction它对离群值也不敏感本文通过3个案例分别介绍了随机森林在昆虫种类的判别分析有无数据的分析取代逻辑斯蒂回归和回归分析上的应用案例的数据格式和R语言代码可为研究随机森林在分类与回归分析中的应用提供参考">随机森林randomforest模型是由Breiman和Cutler在2001年提出的一种基于分类树的算法它通过对大量分类树的汇总提高了模型的预测精度是取代神经网络等传统机器学习方法的新的模型随机森林的运算速度很快在处理大数[更多]
2023/2/3 14:01:57 1.86MB 随机森林模型
1
支持向量机(supportvectormachine,SVM)是数据挖掘中的一项新技术,是借助于最优化方法解决机器学习问题的新工具。
它成为克服“维数灾难”和“过学习”等传统困难的有效办法,虽然他还处在飞速发展的阶段,但它的理论基础和实现途径的基本框架已经构成。
支持向量机目前主要用来解决分类问题(模式识别,判别分析)和回归问题。
而股市行为预测通常为预测股市数据的走势和预测股市数据的未来数值。
而当我们将走势看作两种状态(涨、跌),问题便转化为分类问题,而预测股市未来的价格是指为典型的回归问题。
我们有理由相信支持向量机可以对股市进行预测。
本报告是支持向量机对股票价格预测应用报告的综述,旨在于介绍预测股票价格走势的SVM简单预测模型。
该模型可以用来预测未来若干天股票价格的大体走势,这对于股票投资可以起到很好的指导性作用。
2018/9/1 10:39:25 999KB 支持向量机 股票预测
1
第一次:回归分析第二次:聚类与判别分析第一次:回归分析第二次:聚类与判别分析第一次:回归分析第二次:聚类与判别分析第一次:回归分析第二次:聚类与判别分析
2020/8/22 12:22:30 1.31MB 北航 数理统计 孙海燕 冯伟
1
Matlab代码LDA分析,可以用作特征提取或许分类器
2018/1/2 16:04:10 630KB LDA 线性判别分析
1
说话人辨认的局部敏感判别分析
2022/9/8 14:48:39 301KB 研究论文
1
从网站爬取口红销售数据,分析影响销售数据的重要因素以及根据销售因素建模预测其销售量。
本文先将数据进行预处理得到实验数据,然后着重分析朴素贝叶斯判别分析算法、AdaBoost算法以及随机森林算法在口红销量预测中的效果,并在随机森林算法中进行模型优化。
通过实验结果表明总评价数、价格和描述分这三个因素对销售量的影响较大,对三个算法对比分析得出随机森林算法预测错误率最低,有较好的预测效果。
2022/9/8 7:04:18 4.29MB 数据挖掘 R语言
1
共 33 条记录 首页 上一页 下一页 尾页
在日常工作中,钉钉打卡成了我生活中不可或缺的一部分。然而,有时候这个看似简单的任务却给我带来了不少烦恼。 每天早晚,我总是得牢记打开钉钉应用,点击"工作台",再找到"考勤打卡"进行签到。有时候因为工作忙碌,会忘记打卡,导致考勤异常,影响当月的工作评价。而且,由于我使用的是苹果手机,有时候系统更新后,钉钉的某些功能会出现异常,使得打卡变得更加麻烦。 另外,我的家人使用的是安卓手机,他们也经常抱怨钉钉打卡的繁琐。尤其是对于那些不太熟悉手机操作的长辈来说,每次打卡都是一次挑战。他们总是担心自己会操作失误,导致打卡失败。 为了解决这些烦恼,我开始思考是否可以通过编写一个全自动化脚本来实现钉钉打卡。经过一段时间的摸索和学习,我终于成功编写出了一个适用于苹果和安卓系统的钉钉打卡脚本。
2024-04-09 15:03 15KB 钉钉 钉钉打卡