摘要:
简介 假设给定一个自如租房的url,本程序能够实现爬取该网页的价格。经过测试发现,这个程序并不适用于所有的自如租房链接,只适用于大部分链接。(个人认为出现这样的问题与写的规则字符串有关) ① 打开某一个自如租房url。如:http://gz.ziroom.com/x/754308942.html 。 阅读全文
摘要:
在识别验证码的时候,可以调用百度的通用文字识别接口。 步骤 Step1 获取access_token的值。 ① 登陆 https://ai.baidu.com/ ,找到通用文字识别,点击立即使用。 ② 点击创建应用后,会得到API Key 和Secret Key。 ③ 将API Key 和Secre 阅读全文
摘要:
超级鹰 在这个项目中使用超级鹰来识别验证码。超级鹰的官方接入文档如下。 1 #!/usr/bin/env python 2 # coding:utf-8 3 4 import requests 5 from hashlib import md5 6 7 class Chaojiying_Client 阅读全文