Apachekafka是分布式流平台,支持并行处理消息,该官方文档详细引见了kafka的特性和功能
2015/4/18 22:06:07 1.56MB 分布式 kafka
Apachekafka是分布式流平台,支持并行处理消息,该官方文档详细引见了kafka的特性和功能
2015/4/18 22:06:07 1.56MB 分布式 kafka
读teqc+plot参数输入的数据文件,画多路径、电离层、电离层变化率等信息的结果图。
2017/3/23 23:01:57 19KB matlab teqc plot COMPACT3
分词大词库,共366万,普通情况下,足够用。
这是我在做分词项目时,足足找了3天赋找到的上等资源。
比起那些弄点资源然后收5C币要强得多。
2016/2/17 21:44:26 22.91MB 分词
简历最好能覆盖以下三方面的项目经历:基础平台搭建与线上问题解决一方面,许多中小型企业,大数据这一块其实还处于刚刚起步阶段,对于平台搭建这一块是刚需;
另一方面,一线大厂对于线上基础组件,比方说hdfs与spark的补丁修复(能二次开发就更好了)比较感兴趣。
而这些,都可以以项目的方式写进去。
实时计算类项目一个稍微复杂点的实时类项目几乎可以覆盖大数据生态圈的所有核心技术点,具体可以参考本人前期写的一篇文章:征信画像项目实施文档摘要机器学习类项目个人认为,数据部门终极价值的落地需要靠机器学习。
仅仅搞传统BI与实时计算的话,对于大部分中小型企业而言,大数据团队没有多大的存在价值。
2018/2/6 15:10:15 166KB 简历模板
R优秀案例汇合
2017/9/14 17:48:43 17.23MB R语言
大数据组件,官方版本:CDH5.9.0操作零碎:CentOS7/RHEL7完整系列:GPLEXTRAS-5.9.0-1.cdh5.9.0.p0.23-el7.parcelGPLEXTRAS-5.9.0-1.cdh5.9.0.p0.23-el7.parcel.sha
2016/2/4 6:40:47 41B CDH5.9.0 大数据 CDH
ApacheFlinkv1.9民间中文文档.zip
2021/1/13 17:28:13 13.25MB java
外面包含情感词典和否定词停用词程度副词等,还有python的代码,用的是python的ide,pycharm
2021/6/16 23:30:35 14.11MB 情感分析
spssmodeleralgorithmsguide中的贝叶斯收集算法,中文。
2020/4/18 7:43:05 268KB spss modeler algorithms guide
共 1000 条记录 首页 上一页 下一页 尾页