api-ms-win-core-console-l1-1-0.dll
2024/6/2 21:44:35 12KB ssh
基于搜狗查询数据500w条使用MapReduce做数据清洗,hive做离线分析的项目,详细文档附数据连接,搜狗实验室的搜索数据下载后缺少了用户ID字段的数据,所以本分析采用的是完整的数据,大家可以放心下载,如果下载数据的百度云链接失效无法下载,大家可以给我留言。
数据仓库,英文名称为DataWarehouse,可简写为DW或DWH。
数据仓库,是为企业所有级别的决策制定过程,提供所有类型数据支持的战略集合。
它出于分析性报告和决策支持目的而创建。
2024/5/6 22:38:23 4.93MB 数据仓库
用于配置hive驱动,详细配置过程可参考https://blog.csdn.net/qq_32284189中SQuirrelSQLClient数据库连接工具的配置与使用
2024/2/13 5:54:55 15.6MB hive
大数据项目之电商数仓(3系统业务数据仓库).docx
2024/2/3 0:13:06 8.61MB 电商数仓
你是否在数据开发时,某些场景突然需要一张全球机场的字典表?那么我的作用就体现了,好不容易梳理了迄今为止最全的全球机场字典表,并且是excel文档,供各位有需要的人根据场景使用。
是不是相当友好?
2024/2/2 9:21:36 165KB excel 大数据
由于公司要把oracle数据库迁移到hive,hbase环境,特建议使用kettle做数据迁移,调试3个小时,终于调试成功,顺手写了个配置文档。
2024/1/28 23:39:43 377KB kettle ,oracle12c >hive
presto是一个开源的分布式sql查询引擎,数据量支持GB到PB字节,主要用于处理秒级查询的场合。
yanagishima是presto的可视化客户端。
从官网下载的源码需要编译。
yangshima的安装,启动配置见官网:https://github.com/zhaolianchao/yanagishima#quick-start。
如有其他疑问请发邮件到我的邮箱:wenjunlong88_easy@163.com
2024/1/27 18:48:34 67.73MB presto-0.196 yangshima19
mysql-connector-java-5.1.27-bin.jarjar包,可以用这个连接MySQL的,,适合MySQL5版本的,,很不错......
2024/1/22 2:37:31 815KB mysql-connector
php链接HIVE的例子代码,通过thrift使得php和hive可以进行轻松的通信,达到php操作hive的目的。
特别是想要用php做hive的数据挖掘界面展示的用。
2024/1/21 16:08:40 89KB php hive
共 54 条记录 首页 上一页 下一页 尾页