搜索【hdfs】的结果-好快吧下载

kafka+flume及时采集oracle数据到hive中.docx

讲述如何采用最简单的kafka+flume的方式，及时的去读取oracle中的重做日志+归档日志的信息，从而达到日志文件数据及时写入到hdfs中，然后将hdfs中的数据结构化到hive中。

2023/2/12 12:32:41 837KB hadoop kafka flume oracle

1

HDFS全面详解

HadoopHDFS分布式文件系统DFS简介HDFS的系统组成引见HDFS的组成部分详解副本存放策略及路由规则命令行接口Java接口客户端与HDFS的数据流讲解掌握hdfs的shell操作掌握hdfs的javaapi操作理解hdfs的工作原理设计思想分而治之：将大文件、大批量文件，分布式存放在大量服务器上，以便于采取分而治之的方式对海量数据进行运算分析；
在大数据系统中作用：为各类分布式运算框架（如：mapreduce，spark，tez，……）提供数据存储服务重点概念：文件切块，副本存放，元数据补充：hdfs是架在本地文件系统上面的分布式文件系统，它就是个软件，也就是用一套代码把底下所有机器的

2023/2/6 8:29:52 430KB HDFS全面详解

1

用hadoop实现的KMeans算法

用MapReduce实现KMeans算法,数据的读写都是在HDFS上进行的，在伪分布下运转没有问题。
文档中有具体说明。

2018/7/23 9:44:21 13KB hadoop kmeans

1

网站架构技术

大型网站架构演化大型网站软件系统的特点大型网站架构演化发展历程初始阶段应用服务和数据服务分离使用缓存改善网站功能缓存类型本地缓存分布式缓存缓存产品 redis 业界主流 memcached 解决问题数据库访问使用应用服务器集群改善网站的并发处理能力问题:负载均衡情况下session状态的保持? 解决方案: 基于DNS的负载均衡反向代理 ngix JK2 数据库的读写分离问题:读库与写库的数据同步解决方案:不同的数据库都有自己的数据库的主从复制功能使用反向代理与CDN加速网站响应反向代理产品 ngix 使用分布式文件系统和分布式数据库系统使用no-sql和搜索引擎站内搜索 lucene nutch 分词器 no-sql库 mongodb hadoop 业务拆分 webservice restful 分布式服务大型网站架构演化的价值观核心价值：随网站所需灵活应对驱动力量：网站的业务发展网站架构设计误区一味追随大公司的解决方案为技术而技术企图用技术解决一切问题大型网站架构模式架构模式分层分割分布式分布式应用和服务分布式静态资源分布式数据和存储分布式计算集群缓存 CDN 反向代理本地缓存分布式缓存异步冗佘冷备份主从分离，实时同步实现热备份灾备数据中心自动化发布过程自动化 ant maven. 自动化代码管理 svn cvs github 自动化测试 loadrunner hudson. 自动化安全测试自动化部署自动化报警自动化失效转移自动化失效恢复自动化降级自动化分配资源安全密码和手机校验码数据库中的密码加密后存-＞不可ni-＞md5 加密子主题1 验证码防止机器登录对于攻击网站的XSS攻击，SQL注入，进行编码转换对垃圾信息，敏感信息进行过滤对交易转账等重要操作根据交易模式和交易信息进行风险控制 Sina微博的应用大型网站架构要素功能可用性伸缩性扩展性安全性瞬时响应：网站的高功能架构网站的功能测试不同的视角用户的视角开发人员的视角运维人员的视角功能测试指标响应时间并发数吞吐量功能测试方法功能测试负载测试压力测试稳定性测试 web前端功能优化浏览器优化减少http请求使用浏览器缓存启用压缩 css上，js下减少cookie传输，静态资源使用独立域名访问 CDN加速反向代理应用服务器功能优化分布式缓存缓存的原理合理使用缓存频繁修改的数据没有热点的访问数据不一致和脏读缓存可用性缓存预热缓存穿透缓存架构 jbosscache为代表的需要更新同步的分布式级缓存以memcached为代表的不互相通信的分布式缓存异步操作使用集群代码优化多线程资源复用单例对象池数据结构垃圾回收存储功能优化固态硬盘 RAID与HDFS万无一失：网站的高可用性高可性的度量与考核度量考核高可用的网站架构高可用的应用高可用的服务高可用的数据 CAP原理数据备份失效转移高可用网站的软件质量保证网站发布自动化测试预发布验证代码控制自动化发布灰度发布网站运行临控临控数据采集临控管理永无止境：网站的可伸缩性网站架构的伸缩性设计不同功能进行物理分离实现伸缩单一功能通过集群规模实现伸缩应用服务器集群的伸缩性设计 http重定向负载均衡 DNS域名解析负载均衡反向代理负载均衡 ip负载均衡数据链路层负载均衡负载均衡算法分布式缓存集群的伸缩性设计 mem

2021/7/2 17:55:03 1.02MB 网站架构

1

sqoop2javaAPI从oracle导数据到HDFS开发总结新

sqoop2javaAPI从oracle导数据到HDFS开发总结有了这个文档，会为你节省很多时间，一些我踩坑趟路的时间；
但是不代表你什么都不晓得的前提就能把demo运行起来。
建议操作顺序：sqoop官方环境搭建文档看一遍，然后搭建sqoop2环境，然后熟悉sqoop2-shell命令；
然后再做javaapi开发。
整个代码逻辑的调用顺序：sqoopclientjavaApi-＞sqoopserver-＞yarn-＞MRjob

2018/11/14 2:03:41 831KB oracle转HDFS

1

HDFS原理简介

对于HDFS工作原理的部门简单引见。

2019/5/25 5:03:43 680KB HDFS

1

Hadoop，HBase，Hive，HDFS视频，共44集(全套)

Hadoop，HBase，Hive，HDFS视频，共44集(完好全套)！！

2017/6/27 12:41:34 58B Hadoop HBase HDFS Hive

1

大数据数据库入库

hdfs上内容读取到hbase，纯正的Mapreduce代码。
尝尝看，支持多线程

2021/8/25 10:25:55 29KB hbase

1

新尚硅谷大数据技术之Hadoop（入门）

新尚硅谷大数据技术之Hadoop（入门），尚硅谷大数据技术之Hadoop（HDFS文件零碎）.doc尚硅谷大数据技术之Hadoop（MapReduce）.doc尚硅谷大数据技术之Hadoop.xmind等多个文件

2019/6/26 6:06:46 31.76MB Haddop

1

数据开发岗简历编写模板

简历最好能覆盖以下三方面的项目经历：基础平台搭建与线上问题解决一方面，许多中小型企业，大数据这一块其实还处于刚刚起步阶段，对于平台搭建这一块是刚需；
另一方面，一线大厂对于线上基础组件，比方说hdfs与spark的补丁修复（能二次开发就更好了）比较感兴趣。
而这些，都可以以项目的方式写进去。
实时计算类项目一个稍微复杂点的实时类项目几乎可以覆盖大数据生态圈的所有核心技术点，具体可以参考本人前期写的一篇文章:征信画像项目实施文档摘要机器学习类项目个人认为，数据部门终极价值的落地需要靠机器学习。
仅仅搞传统BI与实时计算的话，对于大部分中小型企业而言，大数据团队没有多大的存在价值。

2018/2/6 15:10:15 166KB 简历模板

1

钉钉无人值守自动打卡脚本永不迟到的神器安卓和苹果教程 New!

在日常工作中，钉钉打卡成了我生活中不可或缺的一部分。然而，有时候这个看似简单的任务却给我带来了不少烦恼。每天早晚，我总是得牢记打开钉钉应用，点击"工作台"，再找到"考勤打卡"进行签到。有时候因为工作忙碌，会忘记打卡，导致考勤异常，影响当月的工作评价。而且，由于我使用的是苹果手机，有时候系统更新后，钉钉的某些功能会出现异常，使得打卡变得更加麻烦。另外，我的家人使用的是安卓手机，他们也经常抱怨钉钉打卡的繁琐。尤其是对于那些不太熟悉手机操作的长辈来说，每次打卡都是一次挑战。他们总是担心自己会操作失误，导致打卡失败。为了解决这些烦恼，我开始思考是否可以通过编写一个全自动化脚本来实现钉钉打卡。经过一段时间的摸索和学习，我终于成功编写出了一个适用于苹果和安卓系统的钉钉打卡脚本。

2024-04-09 15:03 15KB 钉钉 钉钉打卡

个人信息

一言

热门下载

最新下载

其他资源