摘要: 爬取要求: 网页爬取范围:5875页-尾页; 基金名称点击进去的二级页面!需要提取《基金类型》、《管理类型》两个字段; 私募基金管理人名称点进去的二级页面,需要提取《登记时间》、《成立时间》字段; 二级页面的四个字段跟到列表页后面形成表格。 代码: import codecs import csv 阅读全文
posted @ 2020-09-06 22:28 小皮浩 阅读(1127) 评论(1) 推荐(0) 编辑
摘要: from PIL import Image def cut_picture(picture_url): """ 切图片 :param picture_url: 图片地址 :return: """ img = Image.open(picture_url) long, wide = img.size 阅读全文
posted @ 2020-09-06 22:15 小皮浩 阅读(153) 评论(0) 推荐(0) 编辑