基于用户的SparkALS推荐系统,内还有测试数据100万,按照流程跑模型不是问题。
下载后请看教程链接https://mp.csdn.net/postedit/84548711
2024/9/26 14:47:58 5.79MB SparkALS
简单明了地为我们介绍了rstudio中一些必须要用到的技巧,将英文转化成了中文,是初学r语言必不可少的哦
2024/9/25 5:01:03 1.62MB R语言 Rstudio
详细总结了大数据开发工程师如何编写自己的简历,罗列出很多细节重点,如何写好自己的简历
2024/9/21 14:03:55 unknown 简历 大数据开发 注意事项
Spark2.4.0学习笔记分享
2024/6/28 2:46:37 4.68MB spark
全国在第六次人口普查的数据,各身份分年龄、性别,格式为Excel。
可用于数据分析。
plugin.xml是对datanucleus的jar包合并的资源文件,在对sparksql项目打包时,datanucleus自身配置文件文件重复而不能正常合并
2024/6/7 10:53:45 150KB xml
2021贺岁大数据入门spark3.0入门到精通资源简介:本课程中使用官方在2020年9月8日发布的Spark3.0系列最新稳定版:Spark3.0.1。
共课程包含9个章节:Spark环境搭建,SparkCore,SparkStreaming,SparkSQL,StructuredStreaming,Spark综合案例,Spark多语言开发,Spark3.0新特性,Spark性能调优。
2024/5/29 11:05:54 467.06MB 大数据 spark
数据分析实现采用Scala编程语言进行实现,通过SparkSQL进行对数据的处理,并把结果存储到MySQL中,最后通过数据可视化技术把数据展示出来
2024/5/16 1:01:33 4.91MB spark scala hadoop
随着网络技术的越发成熟,邮件因其便捷的特性成为广大人民的交流的方式之一。
但网络发展规模越来越大,海量数据问题越发难以处理。
与此同时,垃圾邮件也猖獗异常,甚至携带病毒,为人们日常生活带来了不便。
如何面对海量的垃圾邮件带来的问题已经成为人们亟待解决的严峻挑战。
2024/5/5 3:04:16 5.35MB 中文邮件
全国2014-2018年空气质量csv数据集文件数据,包含字段time(时间),city(城市),AQI,PM2.5,PM10,SO2,NO2,CO,O3,primary_pollutant(主要污染物),共计55万条数据。
2024/5/2 2:41:51 26.74MB 空气质量
共 100 条记录 首页 上一页 下一页 尾页