全国在第六次人口普查的数据,各身份分年龄、性别,格式为Excel。
可用于数据分析。
plugin.xml是对datanucleus的jar包合并的资源文件,在对sparksql项目打包时,datanucleus自身配置文件文件重复而不能正常合并
2024/6/7 10:53:45 150KB xml
2021贺岁大数据入门spark3.0入门到精通资源简介:本课程中使用官方在2020年9月8日发布的Spark3.0系列最新稳定版:Spark3.0.1。
共课程包含9个章节:Spark环境搭建,SparkCore,SparkStreaming,SparkSQL,StructuredStreaming,Spark综合案例,Spark多语言开发,Spark3.0新特性,Spark性能调优。
2024/5/29 11:05:54 467.06MB 大数据 spark
数据分析实现采用Scala编程语言进行实现,通过SparkSQL进行对数据的处理,并把结果存储到MySQL中,最后通过数据可视化技术把数据展示出来
2024/5/16 1:01:33 4.91MB spark scala hadoop
随着网络技术的越发成熟,邮件因其便捷的特性成为广大人民的交流的方式之一。
但网络发展规模越来越大,海量数据问题越发难以处理。
与此同时,垃圾邮件也猖獗异常,甚至携带病毒,为人们日常生活带来了不便。
如何面对海量的垃圾邮件带来的问题已经成为人们亟待解决的严峻挑战。
2024/5/5 3:04:16 5.35MB 中文邮件
全国2014-2018年空气质量csv数据集文件数据,包含字段time(时间),city(城市),AQI,PM2.5,PM10,SO2,NO2,CO,O3,primary_pollutant(主要污染物),共计55万条数据。
2024/5/2 2:41:51 26.74MB 空气质量
python爬虫爬取股票评论,调用百度AI进行语义分析,matlab数据处理,excel作图股票涨跌和评论的关系
慕课网SparkSQL入门到精通到项目实战的世界(全套日志分析)日志文件
2024/4/21 14:13:35 5.28MB 日志文件
2021贺岁大数据入门spark3.0入门到精通资源简介:本课程中使用官方在2020年9月8日发布的Spark3.0系列最新稳定版:Spark3.0.1。
共课程包含9个章节:Spark环境搭建,SparkCore,SparkStreaming,SparkSQL,StructuredStreaming,Spark综合案例,Spark多语言开发,Spark3.0新特性,Spark性能调优。
2024/4/20 19:20:19 615.94MB spark 大数据
使用kafka-log4j-appender可能会用到的jar包版本1.0.1
2024/4/18 4:18:01 3.61MB spark
共 96 条记录 首页 上一页 下一页 尾页