这个是Kettle一个转换的脚本,可以通过这个demo结合java代码来进行数据清洗。
2025/2/24 14:58:18 16KB Kettle Etl
1
决策树代码实现,参考机器学习实战,数据集采用的是adult数据集,增加了数据清洗,该决策树是随机实现的,增加了过拟合的剪枝。
2025/2/7 11:11:17 2.52MB 决策树 数据挖掘 机器学习
1
数据清洗工具Kettel的初级教程,入门级的分享给大家
2025/1/11 19:25:29 5.35MB Kettle pentaho date integration
1
清华大学出版社,数据清洗(大数据应用人才培养系列教材)PPT
2025/1/2 4:47:47 41.74MB 李法平 数据清洗 PPT
1
随着互联网飞速发展,企业业务种类会越来越多,业务数据量会越来越大,当发展到一定规模时,传统的数据存储结构逐渐无法满足企业需求,实时数据仓库就变成了一个必要的基础服务。
以维表Join为例,数据在业务数据源中以范式表的形式存储,在分析时需要做大量的Join操作,降低性能。
如果在数据清洗导入过程中就能流式的完成Join,那么分析时就无需再次Join,从而提升查询性能。
利用实时数仓,企业可以实现实时OLAP分析、实时数据看板、实时业务监控、实时数据接口服务等用途。
但想到实时数仓,很多人的第一印象就是架构复杂,难以操作与维护。
而得益于新版Flink对SQL的支持,以及TiDBHTAP的特性,我们探索了一
1
基于搜狗查询数据500w条使用MapReduce做数据清洗,hive做离线分析的项目,详细文档附数据连接,搜狗实验室的搜索数据下载后缺少了用户ID字段的数据,所以本分析采用的是完整的数据,大家可以放心下载,如果下载数据的百度云链接失效无法下载,大家可以给我留言。
1
简单试水……
2024/4/28 6:17:10 103KB data
1
matlab编写的箱型图异常值清除程序,主要可用于数据清洗等前期的数据处理手段
2024/3/4 9:13:36 1KB matlab delete abnor
1
评分卡模型的介绍(ABCD卡),数据清洗、特征工程的介绍,模型使用的介绍,评分卡模型评价标准的介绍~
2024/2/4 22:47:04 75.51MB 评分卡 LR 申请评分 行为评分
1
一步步教你如何搭建机器翻译系统,包括:1.机器翻译现状41.1什么是机器翻译?41.2相关论文71.3相关会议81.4相关工具82.NMT系统搭建指导92.1获取数据92.2数据预处理102.3模型训练122.4模型的解码及bleu计算133.系统的优化153.1模型的ensemble153.2定制化领域微调153.3迁移学习154.翻译引擎的部署164.1翻译系统概述164.2基于Tensor2tensor的引擎部署164.3简单系统搭建174.4多个模型共同部署的方案185.机器翻译进阶195.1爬虫技术195.2数据清洗195.3数据增强205.4翻译质量评估216.常用框架概述226.1Tensor2tensor226.2Nematus296.3Marian296.4其他框架307.其他307.1Bleu原理307.2BPE原理30
2023/9/26 1:34:17 2.05MB 机器翻译 人工智能 t2t
1
共 23 条记录 首页 上一页 下一页 尾页
在日常工作中,钉钉打卡成了我生活中不可或缺的一部分。然而,有时候这个看似简单的任务却给我带来了不少烦恼。 每天早晚,我总是得牢记打开钉钉应用,点击"工作台",再找到"考勤打卡"进行签到。有时候因为工作忙碌,会忘记打卡,导致考勤异常,影响当月的工作评价。而且,由于我使用的是苹果手机,有时候系统更新后,钉钉的某些功能会出现异常,使得打卡变得更加麻烦。 另外,我的家人使用的是安卓手机,他们也经常抱怨钉钉打卡的繁琐。尤其是对于那些不太熟悉手机操作的长辈来说,每次打卡都是一次挑战。他们总是担心自己会操作失误,导致打卡失败。 为了解决这些烦恼,我开始思考是否可以通过编写一个全自动化脚本来实现钉钉打卡。经过一段时间的摸索和学习,我终于成功编写出了一个适用于苹果和安卓系统的钉钉打卡脚本。
2024-04-09 15:03 15KB 钉钉 钉钉打卡