摘要: 简介 假设给定一个自如租房的url,本程序能够实现爬取该网页的价格。经过测试发现,这个程序并不适用于所有的自如租房链接,只适用于大部分链接。(个人认为出现这样的问题与写的规则字符串有关) ① 打开某一个自如租房url。如:http://gz.ziroom.com/x/754308942.html 。 阅读全文
posted @ 2020-07-03 05:44 菜鸟峰 阅读(329) 评论(0) 推荐(0) 编辑
摘要: 在识别验证码的时候,可以调用百度的通用文字识别接口。 步骤 Step1 获取access_token的值。 ① 登陆 https://ai.baidu.com/ ,找到通用文字识别,点击立即使用。 ② 点击创建应用后,会得到API Key 和Secret Key。 ③ 将API Key 和Secre 阅读全文
posted @ 2020-07-02 22:59 菜鸟峰 阅读(2812) 评论(0) 推荐(0) 编辑
摘要: 超级鹰 在这个项目中使用超级鹰来识别验证码。超级鹰的官方接入文档如下。 1 #!/usr/bin/env python 2 # coding:utf-8 3 4 import requests 5 from hashlib import md5 6 7 class Chaojiying_Client 阅读全文
posted @ 2020-07-02 20:09 菜鸟峰 阅读(274) 评论(0) 推荐(0) 编辑