DOC2vec,是为一群用来产生词向量的相关模型。
这些模型为浅而双层的神经网络,用来训练以重新建构语言学之词文本。
2024/3/23 19:28:01 39.11MB DOC2VEC
用于舆情系统,可以直接拿来算分使用
2024/3/23 9:52:45 366KB 情感分析 词库
HSMM程序(matlab)。
HSMM是一个应用非常广泛的模型。
2024/3/22 19:45:04 4KB HSMM程序(matlab)
hadoop_bayes代码下载,这里是我github下载代码加自己修改运行成功后做实验的代码,供大家参考
2024/3/22 13:10:28 16.78MB hadoop bayes mapreduce 下载
复旦大学中文语料分类数据3个子文档一共有19666个文档是很好的分类语料库
2024/3/21 19:06:57 105.02MB wenbenfenlei
大数据技术之Kafka.docx详细文档
2024/3/21 17:21:25 1.4MB kafka 大数据
西电数据挖掘作业之决策树和文本聚类,
2024/3/21 17:23:46 713KB 西电数据挖掘
本次主要分享关于迁移实际案例与最佳实践更加深入的探讨。
在迁移过程中,我们遇到了很多的预料之外的问题,如字符集问题,数字进位问题,各种OOM等等,更加深入地了解了Spark和RDMBS之间的差异。
在弥补鸿沟和解决问题的过程中,我们做了很多的实践,贡献给了社区很多的反馈,也解决了很多的bug。
即便对于Spark当前不能处理的场景,比如recurisvequery,也有了一些可行的探索。
此外,我们现在还开发了一套自动化框架来帮助加速迁移工作。
在这次分享中,我们会深入迁移的关键步骤,并分享踩过的一些坑,最后会介绍我们的自动化工具,如SQLConverter等。
相信对正工作在类似的任务或者即将开展类似工作的工程师们会有所帮助。
下面是PPT原文:关注Hadoop技术博文并回复ebay_spark获取本文PPT。
2024/3/21 13:19:03 14.5MB ebay iteblo 过往记忆
大数据分析系统可视化效果,分5个子模块,每个模块1个页面
2024/3/21 7:47:25 2.74MB 数据可视化
介绍区块链技术的背景,整体技术原理,以及相关应用。
2024/3/18 17:14:08 4.58MB 区块链
共 1000 条记录 首页 上一页 下一页 尾页