MapReduce采用"分而治之"的思想,把对大规模数据集的操作,分发给一个主节点管理下的各个分节点共同完成,然后通过整合各个节点的中间结果,得到最终结果。
简单地说,MapReduce就是"任务的分解与结果的汇总"。
在Hadoop中,用于执行MapReduce任务的机器角色有两个:一个是JobTracker;
另一个是TaskTracker,JobTracker是用于调度工作的,TaskTracker是用于执行工作的。
一个Hadoop集群中只有一台JobTracker。
在分布式计算中,MapReduce框架负责处理了并行编程中分布式存储、工作调度、负载均衡、容错均衡、容错处理以及网络通信等复杂问
2023/12/19 16:05:55 595KB hadoopMapReduce实例解析
1
数据集用于语音情感分析训练数据库。
可以用于机器学习,深度学习。
该数据集是CASIA语料库,该数据只用于学习。
2023/12/19 14:24:35 95.59MB 语音 情感分析 训练集
1
压缩包里有三个文件,一个是裁剪过的165张jpg图像构成的文件夹,一个是32x32大小的mat文件,还有一个是64x64大小的mat文件。
注意:这个数据集不是YaleB,也不是ExtendedYaleB数据集!
2023/12/18 9:09:27 1.96MB Yale 人脸识别 数据集
1
机器学习实验数据集
2023/12/18 7:45:08 44KB 数据集
1
用于blog中实现DeepLabv3+在自己数据集上训练,可直接加载该文件。
用于blog中实现DeepLabv3+在自己数据集上训练,可直接加载该文件。
2023/12/18 6:39:25 178.13MB Camvid TFRecord
1
Corel5k数据集(带标注,训练与测试集)。
2023/12/17 16:43:58 63.76MB Corel5k 数据集 带标注 训练
1
pyspark分析流式传输,分析和发现数据中的价值#更多好事尚未到来#spam_mia.zip是垃圾邮件预测管道模型的数据集
2023/12/17 12:34:23 313KB JupyterNotebook
1
本案例采用MNIST数据集对sklearn常用的分类算法进行训练,然后用训练后的模型来识别自己手写的数据。
本文采用sklearn里面最常用的分类算法:RandomForestClassifier、KNeighborsClassifier、SVC、MultinomialNB作为代表进行分析学习。
2023/12/16 15:34:52 1.19MB python sklearn mnist
1
深度学习离不开数据集,该代码为辅助人工进行快速增加标签,或人工评价结果质量,并将根据评价结果将数据保存到对应文件夹
2023/12/16 13:37:14 925B 人工标签辅助
1
豆瓣电影数据集12万+用户影评40万+爬虫程序(两个csv,一个db数据库)最近在学习爬虫,辛辛苦苦爬了几天,分享给大家。

可以用来做推荐系统觉得好的朋友帮忙评论下打个5星~可以看下这篇文章https://blog.csdn.net/qq_37717661/article/details/81458779
2023/12/16 11:01:22 42.45MB 数据集 豆瓣 爬虫
1
共 1000 条记录 首页 上一页 下一页 尾页
在日常工作中,钉钉打卡成了我生活中不可或缺的一部分。然而,有时候这个看似简单的任务却给我带来了不少烦恼。 每天早晚,我总是得牢记打开钉钉应用,点击"工作台",再找到"考勤打卡"进行签到。有时候因为工作忙碌,会忘记打卡,导致考勤异常,影响当月的工作评价。而且,由于我使用的是苹果手机,有时候系统更新后,钉钉的某些功能会出现异常,使得打卡变得更加麻烦。 另外,我的家人使用的是安卓手机,他们也经常抱怨钉钉打卡的繁琐。尤其是对于那些不太熟悉手机操作的长辈来说,每次打卡都是一次挑战。他们总是担心自己会操作失误,导致打卡失败。 为了解决这些烦恼,我开始思考是否可以通过编写一个全自动化脚本来实现钉钉打卡。经过一段时间的摸索和学习,我终于成功编写出了一个适用于苹果和安卓系统的钉钉打卡脚本。
2024-04-09 15:03 15KB 钉钉 钉钉打卡