随笔分类 -  python 网络爬虫

摘要:当需要的信息要经过两个链接才能打开的时候,就需要用到嵌套爬取。 比如要爬取起点中文网排行榜的小说简介,找到榜单网址:https://www.qidian.com/all?orderId=&style=1&pageSize=20&siteid=1&pubflag=0&hiddenField=0&pag 阅读全文
posted @ 2019-07-11 19:14 知道了呀~ 阅读(2126) 评论(0) 推荐(0) 编辑
摘要:从网页爬取文本信息: eg:从http://computer.swu.edu.cn/s/computer/kxyj2xsky/中爬取讲座信息(讲座时间和讲座名称) 注:如果要爬取的内容是多页的话,网址一定要从第二页开始,因为有的首页和其他页的网址有些区别 代码 import pymysql impo 阅读全文
posted @ 2019-07-07 11:13 知道了呀~ 阅读(7307) 评论(1) 推荐(0) 编辑
摘要:首先要连接自己的数据库 import pymysql import requests #需要导入模块 db = pymysql.connect('localhost', 'root', '*********', 'mysql')#第三个是数据库密码,第四个是数据库名称 print("数据库连接成功! 阅读全文
posted @ 2019-07-06 22:25 知道了呀~ 阅读(3100) 评论(0) 推荐(0) 编辑

点击右上角即可分享
微信分享提示