第1篇自己动手抓取数据第1章全面剖析网络爬虫1.1抓取网页1.1.1深入理解url1.1.2通过指定的url抓取网页内容1.1.3java网页抓取示例1.1.4处理http状态码1.2宽度优先爬虫和带偏好的爬虫1.2.1图的宽度优先遍历1.2.2宽度优先遍历互联网1.2.3java宽度优先爬虫示例1.2.4带偏好的爬虫1.2.5java带偏好的爬虫示例1.3设计爬虫队列1.3.1爬虫队列1.3.2使用berkeleydb构建爬虫队列1.3.3使用berkeleydb构建爬虫队列示例1.3.4使用布隆过滤器构建visited表1.3.5详解heritrix爬虫队列1.4设计爬虫架构.1.4.1爬虫架构1.4.2设计并行爬虫架构1.4.3详解heritrix爬虫架构1.5使用多线程技术提升爬虫功能1.5.1详解java多线程1.5.2爬虫中的多线程1.5.3一个简单的多线程爬虫实现1.5.4详解heritrix多线程结构1.6本章小结第2章分布式爬虫2.1设计分布式爬虫2.1.1分布式与云计算2.1.2分布式与云计算技术在爬虫中的应用——浅析google的云计算架构2.2分布式存储
2015/10/13 12:08:15 1.96MB 网络爬虫 pdf 网络 自己动手
1
GoogleBookDownloader可以协助你直接下载GoogleBooks的PDF图书,只要把当前图书网页的地址复制到GoogleBookDownloader里,它就可以协助你下载整个PDF到硬盘里,包括那些本来不提供PDF下载的整本图书或只有部分预览的图书,起码可以下载到部分内容。
标签:Google
2019/5/8 10:58:14 1.34MB 开源项目
1
大名鼎鼎的GOOGLE谁都用过而却好多人也晓得怎么用google强大的搜索功能找到一些重要亦或者是敏感的文件,但是google的高级功能不是每一个人都会用,这里有个专门利用的工具……进口的。
googlehack
2021/11/9 21:57:14 432KB Google Hack V2.0.rar
1
Java实现类似图片搜索原理源码分享。
Google"类似图片搜索":你可以用一张图片,搜索互联网上所有与它类似的图片。
这种技术的原理是什么?计算机怎么知道两张图片类似呢?根据NealKrawetz博士的解释,原理非常简单易懂。
我们可以用一个快速算法,就达到基本的效果。
这里的关键技术叫做"感知哈希算法"(Perceptualhashalgorithm),它的作用是对每张图片生成一个"指纹"(fingerprint)字符串,然后比较不同图片的指纹。
结果越接近,就说明图片越类似。
这是一个最简单的实现。
图片搜索Java
2015/3/23 3:05:23 309KB 图片 搜索 Java 源码
1
对于winsip这个软件大家肯定比较熟悉,Winsip作为一款VOIP压力测试软件,含有很多自定义的功能,由于网上对于winsip的使用教程特别少,甚至于在google中搜索winsip时结果都是关于WinZip的网页,对winsip的深入介绍的资料几乎找不到。
我在工作过程中发现winsip对于voip的测试还是有很大协助的,所以现在根据使用经验特撰此文,希望对大家有协助。
Winsip的最新版本还加入了脚本流程和数据库连接的功能,可谓功能强大,但由于找不到共享版本,所以只能以网上流传的破解版本来介绍,虽然版本比较老,但是所具有的功能也不少。
2017/10/24 4:57:02 6.35MB winsip 注册机
1
一套完整的googledrive认证系统,可以根据以下命令编译运转:将申请的ClientID和Clientsecrets加入到client_secrets.jsoncd.(当前源码根路径)mkdirbindir/b/ssrc\*.java>src.listjavac-sourcepathsrc-dbin-classpath"lib/*;"@src.listcopyclient_secrets.jsonbin\java-classpath"bin;lib/*;"com.google.oauth2.Oauth2
2017/3/20 3:35:26 5.13MB google oauth2.0 java
1
周一的早晨,当你正在纳闷周末咋就一眨眼过去了并对接下来漫长的一周感到无比蛋疼之时,你收到了一份Email。
操蛋的是它既不是微软的offer也不是Google的offer,而是客户发来的一个新需求。
他说你们现在帮我们公司做了很多的ASP.NET的网站和忽悠我们上线的各种系统,现在我想要我的客户只需在我们拥有的任何一个网站上登录一次,那么在我所有的网站上该用户就都已经登录了,同样,随便他从哪个网站上注销掉,那么他也就从我们所有的网站上注销了......你受不了客户这么罗嗦了,心想不就是要一个SSO功能吗?使用ASP.NET的formauth
2020/8/10 14:06:06 262KB 跨域SSO的实现之一:架构设计
1
内容包含了离线谷歌卫星地图的APIV3版本的,并且里面有地图使用的示范,包括离线瓦片如何拼接显示。
2020/1/4 5:01:29 6.91MB 谷歌地图API 瓦片应用实例
1
Google计算思维课程2-1算法探究-计算机科学-旅行2-2算法探究-人文学科-与时俱进的字词2-3算法探究-数学-元胞自动机2-4算法探究-生命科学-基因组学3-1模式发掘-计算机科学-数据紧缩3-2模式发掘-人文学科-音乐。


4-4算法开发-科学-弹力球青少年启蒙编程培训方案青少年启蒙编程培训方案青少年启蒙编程培训方案
2016/7/25 18:28:08 26.95MB 少儿编程
1
简介可以简化配置的GuiaOpenBox(Bunsenlabs)Linux的特别版,可以方便地在Linux上运行,也可以在Portanto上运行,而在Google上则可以使用它。
Aceitosugestõesedicasparamelhoraromeuenvironmente,lembrandoqueessassãoasminhasconfigurações,fizparaomeuuso,fiqueavontadeparafazermudançasemseusistemaestouapenascompartilhandoosmeusconhecimentXFCEGNOMELXDEKDEI3WM可以协助您解决所有问题,请参见“estilo”。
一种最原始的概念,它代表了产品的重要性,被称为“tecteco”。
DICAS
2021/2/4 3:11:37 15.6MB Shell
1
共 448 条记录 首页 上一页 下一页 尾页
在日常工作中,钉钉打卡成了我生活中不可或缺的一部分。然而,有时候这个看似简单的任务却给我带来了不少烦恼。 每天早晚,我总是得牢记打开钉钉应用,点击"工作台",再找到"考勤打卡"进行签到。有时候因为工作忙碌,会忘记打卡,导致考勤异常,影响当月的工作评价。而且,由于我使用的是苹果手机,有时候系统更新后,钉钉的某些功能会出现异常,使得打卡变得更加麻烦。 另外,我的家人使用的是安卓手机,他们也经常抱怨钉钉打卡的繁琐。尤其是对于那些不太熟悉手机操作的长辈来说,每次打卡都是一次挑战。他们总是担心自己会操作失误,导致打卡失败。 为了解决这些烦恼,我开始思考是否可以通过编写一个全自动化脚本来实现钉钉打卡。经过一段时间的摸索和学习,我终于成功编写出了一个适用于苹果和安卓系统的钉钉打卡脚本。
2024-04-09 15:03 15KB 钉钉 钉钉打卡