08 2019 档案

摘要:前言 其实很简短就是利用爬虫的第三方库Requests与BeautifulSoup。 其实就几行代码,但希望没有开发基础的人也能一下子看明白,所以大神请绕行。 基本环境配置 python 版本:2.7 IDE :pycharm 相关模块 完整代码 阅读全文
posted @ 2019-08-06 20:21 嗨学编程 阅读(784) 评论(0) 推荐(0) 编辑
摘要:1.抓取索引页内容 利用requests请求目标站点,得到索引网页HTML代码,返回结果。 2.抓取详情页内容 解析返回结果,得到详情页的链接,并进一步抓取详情页的信息。 获取页面网址: 单个页面代码: 图片地址 3.下载图片与保存数据库 将图片下载到本地,并把页面信息及图片URL保存到MongDB 阅读全文
posted @ 2019-08-06 14:41 嗨学编程 阅读(440) 评论(0) 推荐(1) 编辑
摘要:用到的包有requests BeautSoup 我爬的是天涯论坛的财经论坛:‘http://bbs.tianya.cn/list.jsp?item=develop’ 它里面的其中的一个帖子的URL:‘http://bbs.tianya.cn/post develop 2279340 1.shtml’ 阅读全文
posted @ 2019-08-04 15:49 嗨学编程 阅读(698) 评论(0) 推荐(0) 编辑
摘要:第一步: 先分析这个url,”?“后面的都是它的关键字,requests中get函数的关键字的参数是params,post函数的关键字参数是data, 关键字用字典的形式传进去,这样我们就可以自己改关键字去搜索别的东西或者是搜索别的页面,我对手机比较感兴趣所以 就爬取了关于手机的页面。 第二步: 直 阅读全文
posted @ 2019-08-04 15:48 嗨学编程 阅读(856) 评论(0) 推荐(0) 编辑
摘要:转载:https://www.cnblogs.com/binglansky/p/8534544.html 开发环境: python2.7 + win10 开始先说一下,访问youtube需要那啥的,请自行解决,最好是全局代理。 实现代码: coding:utf 8 author : Corleone 阅读全文
posted @ 2019-08-04 14:25 嗨学编程 阅读(1277) 评论(0) 推荐(0) 编辑
摘要:安装开发需要的一些库 (1) 安装mysql 的驱动:在Windows上按win+r输入cmd打开命令行,输入命令pip install pymysql,回车即可。 (2) 安装自动化测试的驱动selenium:在命令行中输入pip install selenium回车。 (3) 安装标签解析库py 阅读全文
posted @ 2019-08-04 14:12 嗨学编程 阅读(1107) 评论(0) 推荐(0) 编辑