首页 开发技术 Python     /    python新浪微博爬虫,爬取微博和用户信息(含源码及示例)

python新浪微博爬虫,爬取微博和用户信息(含源码及示例)

上传者: eastmount | 上传时间:2022/9/5 4:49:16 | 文件大小:111KB | 文件类型:rar
python新浪微博爬虫,爬取微博和用户信息(含源码及示例)
这是新浪微博爬虫,采用python+selenium实现。
免费资源,希望对你有所帮助,虽然是傻瓜式爬虫,但是至少能运行。
同时rar中包括源码及爬取的示例。
参考我的文章:http://blog.csdn.net/eastmount/article/details/50720436[python爬虫]Selenium爬取新浪微博内容及用户信息http://blog.csdn.net/eastmount/article/details/51231852[Python爬虫]Selenium爬取新浪微博客户端用户信息、热点话题及评论(上)主要爬取内容包括:新浪微博手机端用户信息和微博信息。
用户信息:包括用户ID、用户名、微博数、粉丝数、关注数等。
微博信息:包括转发或原创、点赞数、转发数、评论数、发布时间、微博内容等。
安装过程:1.先安装Python环境,作者是Python2.7.82.再安装PIP或者easy_install3.通过命令pipinstallselenium安装selenium,它是自动测试、爬虫的工具4.然后修改代码中的用户名和密码,填写你自己的用户名和密码5.运行程序,自动调用Firefox浏览器登陆微博注意:手机端信息愈加精致简单,而且没有动态加载的一些限制,但是如微博或粉丝id只显示20页,这是它的缺点;
而客户端可能存在动态加载,如评论和微博,但是它的信息愈加完整。
[源码]爬取移动端微博信息spider_selenium_sina_content.py输入:明星用户id列表,采用URL+用户id进行访问(这些id可以从一个用户的关注列表里面获取)SinaWeibo_List_best_1.txt输出:微博信息及用户基本信息SinaWeibo_Info_best_1.txtMegry_Result_Best.py该文件用户整理某一天的用户微博信息,如2016年4月23日[源码]爬取客户端微博信息爬取客户端信息,但是评论是动态加载,还在研究中weibo_spider2.pyBy:Eastmount2016-04-24

文件下载

资源详情

-Python

评论信息

  • 子山-+:
    不错,跟描述的一样的,谢谢还行2019-12-28
  • 夕阳如火:
    还行吧,算是不错的2019-07-15
  • ruochenxing1:
    比相关书籍介绍的详细,顶一个.2019-05-29
  • IgorSun:
    不错,跟描述的一样的,谢谢2019-05-20
  • 空灵竹:
    不错,跟描述的一样的,谢谢2019-01-18

免责申明

【好快吧下载】的资源来自网友分享,仅供学习研究,请务必在下载后24小时内给予删除,不得用于其他任何用途,否则后果自负。基于互联网的特殊性,【好快吧下载】 无法对用户传输的作品、信息、内容的权属或合法性、合规性、真实性、科学性、完整权、有效性等进行实质审查;无论 【好快吧下载】 经营者是否已进行审查,用户均应自行承担因其传输的作品、信息、内容而可能或已经产生的侵权或权属纠纷等法律责任。
本站所有资源不代表本站的观点或立场,基于网友分享,根据中国法律《信息网络传播权保护条例》第二十二条之规定,若资源存在侵权或相关问题请联系本站客服人员,8686821#qq.com,请把#换成@,本站将给予最大的支持与配合,做到及时反馈和处理。关于更多版权及免责申明参见 版权及免责申明