mapreduce实现apriori算法,亲测可行!需要自行下载数据集。
数据集链接如下http://fimi.ua.ac.be/data/
2024/1/14 0:06:30 90KB apriori mapreduce
1
本人将conll相关的数据集做了整理,大家可以下载使用,我也写了相关的数据集的说明,也在我的博客里.希望大家有兴趣的可以一块交流学习.
2024/1/12 20:19:36 4.68MB conll语料库
1
数据挖掘中公共测试数据集,你可以从这里下载,很方便的啊,哈哈
2024/1/12 17:37:38 409KB UCI数据集
1
SVM入门代码,附数据集代码,可以直接应用学习,注释清楚
2024/1/12 6:42:30 3KB SVM
1
一组用于操纵数据的小型,免费和开源软件工具。
这些工具生成的S1000D数据集的一些示例在此处提供:这些工具主要是围绕规范的版本5.0开发的,并且通常与以前的4.X版本兼容。
对Issue3.0及更低版本的支持尚在开发中。
不计划支持SGML模式。
附加链接:
2024/1/6 17:09:08 8.07MB documentation xml documentation-tool s1000d
1
PCA(主成分分析)算法,主要用于数据降维,保留了数据集中对方差贡献最大的若干个特征来达到简化数据集的目的。
实现数据降维的步骤:1、将原始数据中的每一个样本用向量表示,把所有样本组合起来构成一个矩阵,通常需对样本矩阵进行处理,得到中性化样本矩阵2、求样本矩阵的协方差矩阵3、求协方差矩阵的特征值和特征向量4、将求出的特征向量按照特征值的大小进行组合形成一个映射矩阵。
并根据指定的PCA保留的特征个数取出映射矩阵的前n行或者前n列作为最终的映射矩阵。
5、用映射矩阵对数据进行映射,达到数据降维的目的。
2024/1/6 15:32:43 24KB PCA
1
CMU公开的RACE数据集,原来是txt文件,不方便读取。
这个版本是json数据集,做了简单的格式调整,python使用起来更方便.
2024/1/5 18:20:30 32.61MB RACE NLP json
1
CSE-CIC-IDS2018加拿大入侵检测数据集Thursday数据
2024/1/4 19:10:20 137.42MB 入侵检测 CSE-CIC-IDS2018 数据集
1
hdfs是hadoop的分布式文件系统,即HadoopDistributedFilesystem。
下面主要讲下HDFS设计中的比较重要的点,使读者能通过简短的文章一窥HDFS的全貌,适合对HDFS有一点了解,但是对HDFS又感到困惑的初学者。
本文主要参考的是。
当数据集的大小超过了一台物理机所能存储的能力时,就需要将它进行分区并存储到若干不同的独立的计算机上,其中管理跨多台计算机存储的文件系统称为分布式文件系统。
目录使用HDFS的场景HDFS的工作模式文件系统命名空间(namespace)数据复制文件系统元数据的持久化通讯协议健壮性数据组织可访问性存储空间回收HDFS适合于以流式数据访问模式来存
2024/1/3 22:57:22 511KB 浅析HDFS架构和设计
1
神经网络预测天气的气温数据集,包括了:year,moth,day,week分别表示的具体的时间;
temp_2:前天的最高温度值;
temp_1:昨天的最高温度值;
average:在历史中,每年这一天的平均最高温度值;
actual:这就是我们的标签值了,当天的真实最高温度;
friend:这列用不到暂不用管
2023/12/29 14:56:15 11KB 数据集
1
共 1000 条记录 首页 上一页 下一页 尾页
在日常工作中,钉钉打卡成了我生活中不可或缺的一部分。然而,有时候这个看似简单的任务却给我带来了不少烦恼。 每天早晚,我总是得牢记打开钉钉应用,点击"工作台",再找到"考勤打卡"进行签到。有时候因为工作忙碌,会忘记打卡,导致考勤异常,影响当月的工作评价。而且,由于我使用的是苹果手机,有时候系统更新后,钉钉的某些功能会出现异常,使得打卡变得更加麻烦。 另外,我的家人使用的是安卓手机,他们也经常抱怨钉钉打卡的繁琐。尤其是对于那些不太熟悉手机操作的长辈来说,每次打卡都是一次挑战。他们总是担心自己会操作失误,导致打卡失败。 为了解决这些烦恼,我开始思考是否可以通过编写一个全自动化脚本来实现钉钉打卡。经过一段时间的摸索和学习,我终于成功编写出了一个适用于苹果和安卓系统的钉钉打卡脚本。
2024-04-09 15:03 15KB 钉钉 钉钉打卡