摘要: # 百度翻译爬虫 **今日目标** 百度翻译能够随意输入内容并进行翻译 思路:在JS文件里面找到sign对应的m(a)函数,再用pyexecjs模块在Python中是实现 ```python import requests import re import execjs class BaiduTranslateSpider(object): def __init__(self):... 阅读全文
posted @ 2019-07-25 21:53 Dragon、 阅读(1140) 评论(0) 推荐(0) 编辑
摘要: # 有道翻译爬虫 **今日目标** 有道翻译能够随意输入内容并进行翻译 ```python import requests import time import random from hashlib import md5 # 获取salt sign ts def get_salt_sign_ts(word): # ts ts = str(int(time.time() *... 阅读全文
posted @ 2019-07-24 22:27 Dragon、 阅读(614) 评论(0) 推荐(0) 编辑
摘要: # 链家新房爬虫 **今日目标** 爬取最新地区以及对应的房价 ```python import requests import re import csv class LianjiaSpider(object): def __init__(self): self.url='https://cq.lianjia.com/ershoufang/pg{}/' ... 阅读全文
posted @ 2019-07-23 22:18 Dragon、 阅读(287) 评论(0) 推荐(0) 编辑
摘要: import requests class DoubanSpider(object): def __init__(self): self.url='https://movie.douban.com/j/chart/top_list?' self.headers = { "Accept": '*/*', "A... 阅读全文
posted @ 2019-07-23 22:13 Dragon、 阅读(760) 评论(0) 推荐(0) 编辑
摘要: # 电影天堂爬虫 **今日目标** 爬取电影天堂前30页最新电影以及下载地址 ```python # 1. 打印程序执行时间 # 2. 数据爬下来后做处理(字符串),定义成字典 # 3. 一条龙: 获取 -> 调用解析 -> 数据处理 from urllib import request import time import re import pymysql import random ... 阅读全文
posted @ 2019-07-21 22:52 Dragon、 阅读(10871) 评论(0) 推荐(1) 编辑