时间序列数据挖掘中的特征表示与相似性度量方法研究,博士论文
2023/6/5 12:06:04 25.26MB 时间序列 数据挖掘 人工智能 统计
1
十大算法PPT介绍82页包含十大经典算法的汇报加上各算法的适应情况及各自优缺点。
2023/6/5 4:29:43 22.97MB 十大算法
1
Spark是UCBerkeleyAMPlab所开源的类HadoopMapReduce的通用的并行计算框架,Spark基于mapreduce算法实现的分布式计算,拥有HadoopMapReduce所具有的优点;
但不同于MapReduce的是Job中间输出和结果可以保存在内存中,从而不再需要读写HDFS,因此Spark能更好地适用于数据挖掘与机器学习等需要迭代的mapreduce的算法。
其架构如下图所示:Spark的中间数据放到内存中,对于迭代运算效率更高。
Spark更适合于迭代运算比较多的ML和DM运算。
因为在Spark里面,有RDD的抽象概念。
Spark比Hadoop更通用。
Spark提供的数
1
瑞芯微RK3399软件件设计资料RK3399LinuxDebian软件开发文档资料,SDK是基于Linux64bit系统,内核基于kernel4.40,适用于RK3399挖掘机以及基于其上所有linux开发产品。
支持VPU硬解码、GPU3D、QT等功能。
1
做文本分析可视化分析,社会网络分析,共被引分析,非常强大。
2023/5/15 18:54:02 80.29MB 文本挖掘 社会网络分析 共被引分析
1
描述性时序分析,统计性时序分析,频域分析,时域分析,时序数据挖掘,时间序列挖掘(平滑法预测、趋势预测、季节性预测、符合型时间序列预测…)
2023/3/17 0:09:13 4.11MB 数据分析方法
1
是一款可以把电脑屏幕的所有操作都给录像下来的监控软件,有了它,您就可以轻松实现如下功能:1、监视小孩子,了解孩子能否上不良网站,以能及时的防止小孩子走上弯路。
2、监视自己的老婆(老公)能否在网络上跟别人有暧昧关系,预防..3、监视自己的电脑,可以了解能否有人偷偷的拷贝您的资料。
4、更多的用途待您的挖掘....
2023/3/10 12:22:34 1.47MB 微方 电脑屏幕监控 录像
1
数据挖掘算法算法目录18大DM算法包名 目录名 算法名AssociationAnalysis DataMining_Apriori Apriori-关联规则挖掘算法AssociationAnalysis DataMining_FPTree FPTree-频繁模式树算法BaggingAndBoosting DataMining_AdaBoost AdaBoost-装袋提升算法Classification DataMining_CART CART-分类回归树算法Classification DataMining_ID3 ID3-决策树分类算法Classification DataMining_KNN KNN-k最近邻算法工具类Classification DataMining_NaiveBayes NaiveBayes-朴素贝叶斯算法Clustering DataMining_BIRCH BIRCH-层次聚类算法Clustering DataMining_KMeans KMeans-K均值算法GraphMining DataMining_GSpan GSpan-频繁子图挖掘算法IntegratedMining DataMining_CBA CBA-基于关联规则的分类算法LinkMining DataMining_HITS HITS-链接分析算法LinkMining DataMining_PageRank PageRank-网页重要性/排名算法RoughSets DataMining_RoughSets RoughSets-粗糙集属性约简算法SequentialPatterns DataMining_GSP GSP-序列模式分析算法SequentialPatterns DataMining_PrefixSpan PrefixSpan-序列模式分析算法StatisticalLearning DataMining_EM EM-期望最大化算法StatisticalLearning DataMining_SVM SVM-支持向量机算法其他经典DM算法包名 目录名 算法名Others DataMining_ACO ACO-蚁群算法Others DataMining_BayesNetwork BayesNetwork-贝叶斯网络算法Others DataMining_CABDDCC CABDDCC-基于连通图的分裂聚类算法Others DataMining_Chameleon Chameleon-两阶段合并聚类算法Others DataMining_DBSCAN DBSCAN-基于密度的聚类算法Others DataMining_GA GA-遗传算法Others DataMining_GA_Maze GA_Maze-遗传算法在走迷宫游戏中的应用算法Others DataMining_KDTree KDTree-k维空间关键数据检索算法工具类Others DataMining_MSApriori MSApriori-基于多支持度的Apriori算法Others DataMining_RandomForest RandomForest-随机森林算法Others DataMining_TAN TAN-树型朴素贝叶斯算法Others DataMining_Viterbi Viterbi-维特比算法18大经典DM算法18大数据挖掘的经典算法以及代码实现,涉及到了决策分类,聚类,链接挖掘,关联挖掘,模式挖掘等等方面,后面都是相应算法的博文链接,希望能够协助大家学。
目前追加了其他的一些经典的DM算法,在others的包中涉及聚类,分类,图算法,搜索算等等,没有具体分类。
C4.5C4.5算法与ID3算法一样,都是数学分类算法,C4.5算法是ID3算法的一个改进。
ID3算法采用信息增益进行决策判断,而C4.5采用的是增益率。
详细介绍链接CARTCART算法的全称是分类回归树算法,他是一个二元分类,采用的是类似于熵的基尼指数作为分类决策,形成决策树后之后还要进行剪枝,我自己在实现整个算法的时候采用的是代价复杂度算法,详细介绍链接KNNK最近邻算法。
给定一些已经训练好的数据,输入一个新的测试数据点,计算包含于此测试数据点的最近的点的分类情况,哪个分类的类型占多数,则此测试点的分类与此相同,所以在这里,有的时候可以复制不同的分类点不同的权重。
近的点的权重大点,远的点自然就小点。
详细介绍链接NaiveBayes朴素贝叶斯算法。
朴素贝叶斯算法是贝叶斯算法里面一种比较简单的分类算法,用到了一个比较重要的贝叶斯定理,用一句简单的话概括就是条件概率的相互转换推导
2023/3/5 1:58:33 220KB 数据挖掘 18大 算法 DM
1
艾滋病疗法的评价及疗效的预测摘要艾滋病是至今人类仍未征服的疾病,流行发展趋势越来越严峻,攻克艾滋病是人类面临的一大难题。
本文给出了艾滋病患者的临床治疗数据,要考虑预测继续治疗的效果,并评价各种治疗方案优劣,预测即根据已有的数据信息推算将来的数据,评价方案的优劣属于决策类问题。
对问题(1),先分析CD4和HIV的浓度的变化趋势,建立微分方程模型,无法求解析解,用软件matlab求出CD4和HIV的参数表达式,从附件的数据信息中挖掘出具有普遍特征的数据,用回归法求参数的值,因为得到的表达式不是常规的形式,只能回归出HIV表达式的参数,CD4的无法求出。
作数据分布图,发现描出的形状同二次曲线的图形相近,二次曲线的图形特性符合CD4的浓度变化趋势。
于是建立待定系数的二次曲线方程模型,先拟合出多组参数值,再用回归法确定最后的值,得出的二次曲线方程。
根据HIV和CD4的浓度表达式结合可以作出提前终止治疗的预测,终止时间在第30周。
问题(2),预测四种疗法的继续治疗效果。
首先将患者按CD4初始浓度分类,仍引用前面的二次曲线模型,用附件二的数据回归出曲线方程的参数。
回归过程中考虑到是要评价不同的疗法,根据疗法的不同把数据分为四类,回归得出四组参数,相应的表达式就是这种疗法的CD4的浓度变化曲线方程。
比较四种疗法的优劣,采用CD4浓度最大值和取得最大值的时间为评判标准,结合更加细化的分类数据画出的图形,从理论上和直观上都证实了评价的结果:疗法4效果最好,疗法3次之,疗法2再次之,疗法1效果较差;
利用二次曲线模型得出最佳方案停止用药的最佳时间为20周,同时由分类法模型得出在四种不同CD4初始浓度的条件下最佳方案停止用药的最佳时间分别为:24周、16周、16周、24周。
两种模型的结果相接近。
问题(3)要考虑药品价格因素的影响,价格和药效的权重无法确定,通过假设权重参数来定量表示价格和药效的关系。
采用层次分析法构建层次结构模型,用特征向量归一化并求组合权向量,找到疗法功能和价格权重的关系。
根据不同经济状况的国家的价格权重的值不一样,得到不同的疗法评价结果。
总结出如下的结论:不发达国家经济落后,价格权重较大,疗法1的评价值较高,疗法4的评价值较低,适合疗法1,对于发达国家应当推广疗法4。
文章的最后对模型地优缺点进行了评价,并作了推广。
关键词艾滋病疗法评价微分方程二次曲线回归层次分析
1
elp希望更多的学生利用这些数据,在研究中想出创新性方法,他们也提供了目前感兴味的一些主题。
一是图片分类。
目前他们虽然能识别出图片中类似于汉堡之类的食物,但是如何评价一张图片是否好看还有待研究。
二是自然语言处理和情感分析。
用户评价数据里有很多能挖掘的元数据,可以用于推断语义、商户属性和情感。
他们想知道评价里表达了什么,是好评还是差评。
三是图像挖掘。
比如说挖掘出用户之间的关系是如何限定他们的使用规律,流行趋势的引导者在一家店火起来之前都是去哪儿吃饭的。
2023/2/23 21:03:24 49B 数据集
1
共 430 条记录 首页 上一页 下一页 尾页
在日常工作中,钉钉打卡成了我生活中不可或缺的一部分。然而,有时候这个看似简单的任务却给我带来了不少烦恼。 每天早晚,我总是得牢记打开钉钉应用,点击"工作台",再找到"考勤打卡"进行签到。有时候因为工作忙碌,会忘记打卡,导致考勤异常,影响当月的工作评价。而且,由于我使用的是苹果手机,有时候系统更新后,钉钉的某些功能会出现异常,使得打卡变得更加麻烦。 另外,我的家人使用的是安卓手机,他们也经常抱怨钉钉打卡的繁琐。尤其是对于那些不太熟悉手机操作的长辈来说,每次打卡都是一次挑战。他们总是担心自己会操作失误,导致打卡失败。 为了解决这些烦恼,我开始思考是否可以通过编写一个全自动化脚本来实现钉钉打卡。经过一段时间的摸索和学习,我终于成功编写出了一个适用于苹果和安卓系统的钉钉打卡脚本。
2024-04-09 15:03 15KB 钉钉 钉钉打卡