好快吧下载 - 大数据

doc2vec的java实现

DOC2vec，是为一群用来产生词向量的相关模型。
这些模型为浅而双层的神经网络，用来训练以重新建构语言学之词文本。

2024/3/23 19:28:01 39.11MB DOC2VEC

中文情感分析词库（包含极值表）第一版

用于舆情系统，可以直接拿来算分使用

2024/3/23 9:52:45 366KB 情感分析 词库

HSMM程序（matlab）

HSMM程序（matlab）。
HSMM是一个应用非常广泛的模型。

2024/3/22 19:45:04 4KB HSMM程序（matlab）

hadoop_bayes代码下载

hadoop_bayes代码下载，这里是我github下载代码加自己修改运行成功后做实验的代码，供大家参考

2024/3/22 13:10:28 16.78MB hadoop bayes mapreduce 下载

复旦大学文本分类数据集

复旦大学中文语料分类数据3个子文档一共有19666个文档是很好的分类语料库

2024/3/21 19:06:57 105.02MB wenbenfenlei

大数据技术之Kafka.docx

大数据技术之Kafka.docx详细文档

2024/3/21 17:21:25 1.4MB kafka 大数据

西电数据挖掘作业之决策树和文本聚类

西电数据挖掘作业之决策树和文本聚类，

2024/3/21 17:23:46 713KB 西电数据挖掘

从MPP数仓迁移至Spark：案例与最佳实践分享

本次主要分享关于迁移实际案例与最佳实践更加深入的探讨。
在迁移过程中，我们遇到了很多的预料之外的问题，如字符集问题，数字进位问题，各种OOM等等，更加深入地了解了Spark和RDMBS之间的差异。
在弥补鸿沟和解决问题的过程中，我们做了很多的实践，贡献给了社区很多的反馈，也解决了很多的bug。
即便对于Spark当前不能处理的场景，比如recurisvequery，也有了一些可行的探索。
此外，我们现在还开发了一套自动化框架来帮助加速迁移工作。
在这次分享中，我们会深入迁移的关键步骤，并分享踩过的一些坑，最后会介绍我们的自动化工具，如SQLConverter等。
相信对正工作在类似的任务或者即将开展类似工作的工程师们会有所帮助。
下面是PPT原文：关注Hadoop技术博文并回复ebay_spark获取本文PPT。

2024/3/21 13:19:03 14.5MB ebay iteblo 过往记忆

大数据可视化分析系统

大数据分析系统可视化效果，分5个子模块，每个模块1个页面

2024/3/21 7:47:25 2.74MB 数据可视化

区块链技术及其应用

介绍区块链技术的背景，整体技术原理，以及相关应用。

2024/3/18 17:14:08 4.58MB 区块链

个人信息

一言

热门下载

最新下载

其他资源