摘要: ''' 中华人民共和国民政局官网中的行政区域代码爬取: 技术点: 1>进入二级页面(数据展示页)时,url发生跳转(js作用的),需要在二级页面源码中找到真实url 2>数据入库实时更新:保存url,下次爬取时,先对比url,若相同,不更新,否则更新 ''' import requests from lxml import... 阅读全文
posted @ 2019-07-25 17:12 一如年少模样 阅读(941) 评论(1) 推荐(0) 编辑
摘要: import requests import time import random from hashlib import md5 def get_salt_sign_ts(word): ts = str(int(time.time() * 1000)) salt = ts + str(random.randint(0, 9)) string = "fanyidesk... 阅读全文
posted @ 2019-07-25 10:42 一如年少模样 阅读(846) 评论(0) 推荐(0) 编辑
摘要: ''' 图像识别: OpenCV基础:OpenCV是一个开源的计算机视觉库。提供了很多图像处理常用的工具。 图像的本质是三维数组 ''' import cv2 as cv import numpy as np # 读取图片 img = cv.imread('./ml_data/forest.jpg' 阅读全文
posted @ 2019-07-25 07:57 一如年少模样 阅读(292) 评论(0) 推荐(0) 编辑