zzzzy09

  博客园  :: 首页  :: 新随笔  :: 联系 :: 订阅 订阅  :: 管理
  445 随笔 :: 0 文章 :: 7 评论 :: 26万 阅读

12 2020 档案

摘要:https://zhuanlan.zhihu.com/p/210169446 阅读全文
posted @ 2020-12-31 17:24 zzzzy09 阅读(56) 评论(0) 推荐(0) 编辑

摘要:Django 每一个view函数的第一个参数都是request,有没想过request里面到底有什么呢? Django使用request和response对象在系统间传递状态。 当一个页面被请示时,Django创建一个包含请求元数据的 HttpRequest 对象。 然后Django调入合适的视图, 阅读全文
posted @ 2020-12-28 10:44 zzzzy09 阅读(466) 评论(0) 推荐(0) 编辑

摘要:HTTP协议向服务器传参 根据服务器的响应方式,客户端的提交形式有大致有以下几种: payload方式: payload是一种以JSON格式进行数据传输的一种方式,在我们请求的headers里设置content-type:application/json,则参数要以payload的形式传给服务器,服 阅读全文
posted @ 2020-12-17 14:31 zzzzy09 阅读(106) 评论(0) 推荐(0) 编辑

摘要:# -*-codong:utf-8 -*- """ 股票成交费用 佣金(买卖双向收取):成交金额*佣金比例(不足5元收取5元) 过户费(买卖双向收取):成交金额*0.002% 印花税(卖出时收取):成交金额*0.1% 我们用1 万 5万 10万 20 万分别计算试一下 佣金 :commission 阅读全文
posted @ 2020-12-16 13:55 zzzzy09 阅读(1215) 评论(0) 推荐(0) 编辑

摘要:使用scrapy 爬取数据 Scrapy is written in pure Python and depends on a few key Python packages (among others): lxml, an efficient XML and HTML parser parsel, 阅读全文
posted @ 2020-12-10 16:11 zzzzy09 阅读(96) 评论(0) 推荐(0) 编辑

摘要:#-*- coding:utf-8 -*- from multiprocessing import Pool from bs4 import BeautifulSoup import requests from lxml import etree import re import os import 阅读全文
posted @ 2020-12-08 15:36 zzzzy09 阅读(231) 评论(0) 推荐(0) 编辑

摘要:通过 PIL 和 Python-tesseract 处理验证码并且进行识别来模拟登陆,在测试中对像素进行增强能显著提升 字符识别的能力 #-*- coding:utf-8 -*- try: from PIL import Image, ImageEnhance except ImportError: 阅读全文
posted @ 2020-12-07 15:25 zzzzy09 阅读(131) 评论(0) 推荐(0) 编辑

摘要:关于爬虫的案例和方法,我们已讲过许多。不过在以往的文章中,大多是关注在如何把网页上的内容抓取下来。今天我们来分享下,当你已经把内容爬下来之后,如何提取出其中你需要的具体信息。 HTML 文档本身是结构化的文本,有一定的规则,通过它的结构可以简化信息提取。于是,就有了lxml、pyquery、Beau 阅读全文
posted @ 2020-12-03 16:01 zzzzy09 阅读(158) 评论(0) 推荐(0) 编辑

摘要:1.简介 XPath是一门在XML和HTML文档中查找信息的语言,可以用来在XML和HTML文档中对元素和属性进行遍历 XPath的安装 Chrome插件XPath Helper 点Chrome浏览器右上角:更多工具 扩展程序 谷歌商店 勾选XPath Helper(需要FQ) 2.语法详解 - x 阅读全文
posted @ 2020-12-02 14:41 zzzzy09 阅读(151) 评论(0) 推荐(0) 编辑

点击右上角即可分享
微信分享提示