摘要:
ocr图片识别通常可以利用tesserocr模块,将图片中内容识别出来并转换为text并输出 Tesserocr是python的一个OCR识别库,是对tesseract做的一层python APT封装。在安装Tesserocr前,需要先安装tesseract tessrtact文件: https:/ 阅读全文
摘要:
前言:做Web自动化时,一般可利用Selenium定位页面元素进行如click,sendKeys类的操作。但也常遇到api没有调用错,却无法定位到元素,或者,无法进行操作。Fortunately,Selenium提供了操作JS的方法:execute_script(),可以直接执行js的脚本。常用的j 阅读全文
摘要:
最近开始学习爬虫框架Scrapy,看大牛写的博客时,发现有段代码不知道如何理解,对,就是它:关键字yield该怎么理解? 在详细查询了文档说明后,得出以下结论: 一个带有 yield 的函数就是一个 generator,它和普通函数不同,生成一个 generator 看起来像函数调用,但不会执行任何 阅读全文
摘要:
最近要写一个水利网站的爬虫脚本,将网页中2个excel的数据,爬到一个excel表里 恩,就是下面的网页截图,一左一右两张表。左边日期控件,输入对应日期查询相应日期的数据。 看到这么简单的网页,真是好开心,分分钟就给你数据 用requests库,发post请求,使用fiddler或者Burpsuit 阅读全文
摘要:
一个网站的爬虫脚本,在调试的时候发现问题: 脚本跑:content-type用text/xml 可以post成功,但post中body的内容没有生效,所有的响应都是当前日期;用application,post不成功(即没有返回数据)工具发:content-type用text/xml 可以post成功 阅读全文
摘要:
Logging模块可以替代print函数的功能,并能将标准输出输入到日志文件保存起来,而且利用logging模块可以部分替代debug的功能,给程序排错。 一、logging模块的几个级别。默认情况下logging模块有6个级别。分别为NOSET值0,DeBUG值为10,INFO值为20,WARNI 阅读全文
摘要:
#贷款额为a,月利率为i,年利率为I,还款月数为na = 500000.00I = 0.11495i = I/12n = 60 print("-----等额本息计算,以5个月为例-----")#月均还款(本金+利息)b = a*i*pow((1+i),n)/(pow((1+i),n)-1)#还款利息总和Y = n*a*i*pow((1+i),n)/(pow((1+i),n)-1)-a#第一个月还款... 阅读全文
摘要:
女生节也要好好更新^_^ 有关python与json编码请查看上篇:http://www.cnblogs.com/hazelrunner/p/8444744.html 下面来区分,用post请求方法传json的两种方法: # coding:utf-8 import requests import j 阅读全文
摘要:
一.要用某个函数,除了百度它的用法,也可以在Python的idle里查看,安装python后搜索IDLE,调出应用程序 如查看所有内建函数:dir() >>>dir(__builtins__) ['__builtins__', '__doc__', '__loader__', '__name__', 阅读全文
摘要:
在初学C语言函数时,经常会遇到形参与实参的区别,参数的传递和改变,变量的作用域问题。 形参,即形式参数,在def关键字定义函数后,做为函数名之后的括号里的变量 实参,即实际参数,在调用函数时传的值或者变量 学习python,也可变通理解,举一个简单栗子说明: >>> def add(x,y): #形 阅读全文