网络爬虫是一种能够自动采集互联网信息的程序。
网络爬虫不但能够作为搜索引擎的采集器,而且可以用于特定信息的采集,根据某些特定的要求采集网站中的信息,如就业,租房信息等。
本文设计并实现了一种基于主题的网络爬虫程序。
网络爬虫采用何种搜索策略和如何评价当前页面的主题相关度是基于主题的网络爬虫需要解决的关键问题。
本文设计的网络爬虫采用广度优先搜索,对url进行解析、去重等。
并应用Java多线程,使爬虫在抓取网页的过程中更有效率。
通常评价页面相关度是采用基于内容评价的搜索策略,本文实现了三个常用的相关度评价算法分别是基于网页内容的相关度算法、基于网页内容和标题的相关度算法、基于网页内容和链接结构的相关度算法。
2024/5/4 1:18:03 35KB 主题爬虫 毕业设计
1
介绍:仅需要输入数据库表名、文件名前缀、文件标题、以及各字段名称,选项各字段相应的属性,即可生成XXXAdd.asp、XXXMod.asp、XXXDel.asp、XXXView.asp、XXXList.asp,五个页面文件,分别代表添加、修改、删除、查看、列表页面。
页面已美化,可直接使用。
使用方法:1、下载后解压,IIS根目录指向文件夹。
2、修改Conn/connStr.asp中的数据库连接语句。
3、访问http://localhost/creat.asp4、填写相关信息后,点“开始生成”,利用“建表SQL”代码到数据库中建表。
5、按提示生成五个页面,页面将生成在website下一个单独的文件夹中。
2024/5/3 0:42:57 869KB 自动 表单 生成
1
中国联通公司ess系统读卡器文件,缴费页面打印控件,安装后问题就解决了。
2024/5/3 0:41:51 1.63MB 控件
1
将kindeditor与ssm完美整合,如果你不是ssm框架,也没关系,核心的代码都已做了修改。
完美显示文件、图片、视频的上传4.11kindeditor版本:新增:俄语语言包,感谢ValeryVotintsev(http://codersclub.org/)。
改善:语言包文件名标准化,zh_CN->zh-CN,zh_TW->zh-TW。
Bugfix:[IE6]当前页面设置了document.domain,销毁编辑器会报错。
Bugfix:行首全角空格被过滤。
Bugfix:修复多语言包的一些小错误。
Bugfix:[IE11]有些设备报错不能显示,对象不支持attachEvent属性或方法。
Bugfix:retina屏幕上按钮裂开。
Bugfix:编辑图片后点击插入图片,弹出两个dialog。
2024/5/1 4:10:08 9.55MB kindeditor SSM 文件上传 图片批量上传
1
MasteringPredictiveAnalyticswithR(2nd)英文无水印pdf第2版pdf转化版,非原版pdfpdf所有页面使用FoxitReader和PDF-XChangeViewer测试都可以打开本资源转载自网络,如有侵权,请联系上传者或csdn删除本资源转载自网络,如有侵权,请联系上传者或csdn删除
2024/4/30 21:56:09 7.36MB Mastering Predictive Analytics R
1
页面非常漂亮的一整套国外新闻网站模板,是完整的一套静态模板。
本资源收集于互联网,如果侵权,请告知删除
2024/4/30 18:06:07 3.47MB HTML5 静态模板
1
1、上机验证教材上第五章示例程序。

2、开发一个页面,当客户第一次访问时,需在线注册姓名、性别等信息,然后把信息保存到Cookies中。
下一次如该客户再访问,则显示“某某,您好,您是第几次光临本站的欢迎信息”。
3.试编写一个ASP程序,实现一个简单的聊天室,能够显示发言人的姓名、发言内容和发言时间等。
(提示:利用Application对象)
2024/4/29 20:41:21 25KB web asp cookie
1
计算机操作系统实验代码(6个实验)包括先来先服务FCFS和短作业优先SJF进程调度算法等。
计算机操作系统实验代码(6个实验)。
计算机操作系统实验代码,包括先来先服务FCFS和短作业优先SJF进程调度算法、时间片轮转RR进程调度算法、预防进程死锁的银行家算法、动态分区分配算法、虚拟内存页面置换算法、磁盘调度算法代码C++
1
WordPress主题vieu基于Dux主题二次开发!的一款专业打造轻量级个人企业风格博客主题!专注于前端开发,全站响应式布局自适应模板。
更新日志:全面支持php7全面支持php7.1,7.2版本可能存在部分函数不支持但不影响使用增加付费下载功能支持有赞和支付宝当面付使用支持免登陆购买增加可开启必须登陆后购买首页焦点图调整首页焦点图更加简洁化,企业化文章页改版文章页增加背景图展示调整整体页面排版对文章页所用到二维码全部本地化生成增加文章一句话概括增加文章资源提示再次升级小工具样式本次升级将小工具放在焦点图下修复评论分页时显示的楼层数字不对问题全局导航栏下拉悬浮调整右下角弹窗广告样式引入新版的展示样式由于新浪图床增加防盗链原因,暂时关闭图床功能,待后期添加其他图床文章页左边栏调整去除左边栏标签等用户中心排版调整增加文章发布后邮件通知所有用户后台可控独立下载页面地址加密显示独立下载功能重新调整更加有效保证资源不被泄露外链跳转新版本,付增加加密显示更加有效提升网站
2024/4/29 11:56:02 75B WordPress主题 模板 源码 网站模版
1
一般开发wap网站都需要这个做软件自动适配下载,页面适配等我收集了一个月的成果这里应该全是gsm的机型,没有cdma的机型因为这是做中国移动的项目,我顺便采集的数据
2024/4/29 6:11:44 2.61MB 手机 ua wap 适配
1
共 1000 条记录 首页 上一页 下一页 尾页
在日常工作中,钉钉打卡成了我生活中不可或缺的一部分。然而,有时候这个看似简单的任务却给我带来了不少烦恼。 每天早晚,我总是得牢记打开钉钉应用,点击"工作台",再找到"考勤打卡"进行签到。有时候因为工作忙碌,会忘记打卡,导致考勤异常,影响当月的工作评价。而且,由于我使用的是苹果手机,有时候系统更新后,钉钉的某些功能会出现异常,使得打卡变得更加麻烦。 另外,我的家人使用的是安卓手机,他们也经常抱怨钉钉打卡的繁琐。尤其是对于那些不太熟悉手机操作的长辈来说,每次打卡都是一次挑战。他们总是担心自己会操作失误,导致打卡失败。 为了解决这些烦恼,我开始思考是否可以通过编写一个全自动化脚本来实现钉钉打卡。经过一段时间的摸索和学习,我终于成功编写出了一个适用于苹果和安卓系统的钉钉打卡脚本。
2024-04-09 15:03 15KB 钉钉 钉钉打卡