根据图识,项目将分为三个部分。
整个项目基本思路是如何通过爬虫爬取大量数据放到Hbase,然后通过ETL工具初步转化筛选将数据存到mongodb,抽取mongodb的数据进行清洗处理算出模型放到hdfs。
后续进来数据通过模型运算出数据的类型。
项目系统主要包括前端+后端+机器学习,前端采用ReactNative,Native,后端采用Dubbo+Spring+java,机器学习采用Spark进行实现,本项目机器学习-spark代码运行在mesos上。
2024/6/3 3:08:56 106B Spark 机器学习 实战
1
Python爬虫,京东自动登录,在线抢购商品
2024/6/2 16:11:21 9KB Python开发-Web爬虫
1
网络搜索引擎的核心介绍,较为详尽的讲解了爬虫技术、倒排索引等核心技术
2024/5/29 10:56:14 34.71MB 搜索引擎
1
一个基于C++的网络爬虫程序,实现了最基本的功能,适合入门级的源码分析
2024/5/29 1:11:35 78KB C++ 网络爬虫
1
使用python对58同城租房信息进行爬取
2024/5/27 2:54:17 11KB 58同城
1
一个多线程的Python爬虫,使用threading,queue模块实现线程同步
2024/5/24 22:46:19 7KB Python,爬虫
1
百度指数爬虫,可以自定义时间段抓取百度指数,非模拟浏览器操作,抓取百度指数的另一种思路
2024/5/21 14:22:30 50KB Python开发-Web爬虫
1
此工具可用于网页数据的爬取,代码中本身就有一个demo,自行参考使用
2024/5/18 4:03:25 1004KB 爬虫工具
1
利用Python爬虫批量下载百度图库图片
2024/5/6 22:49:43 3KB Python 爬虫 百度图库
1
爬取淘宝网商品信息的爬虫源码,可以粘贴到神箭手云爬虫上直接跑。
2024/5/6 5:21:13 15KB 淘宝 爬虫
1
共 527 条记录 首页 上一页 下一页 尾页
在日常工作中,钉钉打卡成了我生活中不可或缺的一部分。然而,有时候这个看似简单的任务却给我带来了不少烦恼。 每天早晚,我总是得牢记打开钉钉应用,点击"工作台",再找到"考勤打卡"进行签到。有时候因为工作忙碌,会忘记打卡,导致考勤异常,影响当月的工作评价。而且,由于我使用的是苹果手机,有时候系统更新后,钉钉的某些功能会出现异常,使得打卡变得更加麻烦。 另外,我的家人使用的是安卓手机,他们也经常抱怨钉钉打卡的繁琐。尤其是对于那些不太熟悉手机操作的长辈来说,每次打卡都是一次挑战。他们总是担心自己会操作失误,导致打卡失败。 为了解决这些烦恼,我开始思考是否可以通过编写一个全自动化脚本来实现钉钉打卡。经过一段时间的摸索和学习,我终于成功编写出了一个适用于苹果和安卓系统的钉钉打卡脚本。
2024-04-09 15:03 15KB 钉钉 钉钉打卡