2018年8月19日

知乎信息爬取(存在bug,望大牛指点)

摘要: import requestsfrom lxml import etreeimport pymysqlclass MysqlHelper(object): def __init__(self): self.db = pymysql.connect(host='127.0.0.1', port=330 阅读全文

posted @ 2018-08-19 22:04 luwanhe 阅读(270) 评论(0) 推荐(0) 编辑

电影天堂的种子爬取(数据获取不全面,存在bug望各位指点)

摘要: import requestsfrom lxml import etreeimport pymysqlfrom urllib import parseclass MysqlHelper(object): def __init__(self): self.db = pymysql.connect(ho 阅读全文

posted @ 2018-08-19 22:03 luwanhe 阅读(2139) 评论(0) 推荐(0) 编辑

腾讯招聘爬取

摘要: import requestsfrom bs4 import BeautifulSoupimport datetimeimport reimport pymysqlimport datetime#数据库封装class Mydb(): def __init__(self): try: self.con 阅读全文

posted @ 2018-08-19 21:46 luwanhe 阅读(251) 评论(0) 推荐(0) 编辑

妹子图爬取

摘要: import requestsimport pymysqlfrom lxml import etree#数据库封装class MysqlHelper(object): def __init__(self): self.db = pymysql.connect(host='127.0.0.1', po 阅读全文

posted @ 2018-08-19 21:41 luwanhe 阅读(161) 评论(0) 推荐(0) 编辑

链家信息爬取

摘要: 一、数据库封装 import pymysqlclass MysqlHelper(object): def __init__(self): self.db = pymysql.connect(host='127.0.0.1', port=3306, user='root', password='abc 阅读全文

posted @ 2018-08-19 10:52 luwanhe 阅读(602) 评论(0) 推荐(0) 编辑

导航