随笔分类 - Python技术
关于Python技术学习和应用
摘要:Python3.x:selenium获取iframe内嵌页面的源码 前言 在一些网页中经常会看到ifrmae/frame标签,iframe是嵌入式框架一般用来在已有的页面中嵌入另一个页面,当一个元素在iframe里时我们应该先切换到iframe里面。 语法 1.进入iframe 2.释放/退出ifr
阅读全文
摘要:Python3.x:Selenium+PhantomJS爬取带Ajax、Js的网页 前言 现在很多网站的都大量使用JavaScript,或者使用了Ajax技术。这样在网页加载完成后,url虽然不改变但是网页的DOM元素内容却可以动态的变化。如果处理这种网页是还用requests库或者python自带
阅读全文
摘要:Python3.x:将数据下载到xls时候用xml格式保存一份读取内容 核心代码:
阅读全文
摘要:Python3.x:访问带参数链接并且获取返回json串 示例一: 示例二:
阅读全文
摘要:Python3.x:pytesseract识别率提高(样本训练) 1,下载并安装3.05版本的tesseract 地址:https://sourceforge.net/projects/tesseract-ocr/ 2,如果你的训练素材是很多张非tif格式的图片,首先要做的事情就是将这么图片合并(个
阅读全文
摘要:Python3.x:logging模块对运行过程记录 示例:
阅读全文
摘要:Python3.x:如何识别图片上的文字 安装pytesseract库,必须先安装其依赖的PIL及tesseract-ocr,其中PIL为图像处理库,而后面的tesseract-ocr则为google的ocr识别引擎; 其中PIL可以用pillow来替代; 一、安装识别引擎tesseract-ocr
阅读全文
摘要:Python3.x:BeautifulSoup()解决中文乱码问题 问题: BeautifulSoup获取网页内容,中文显示乱码; 解决方案: 遇到情况也是比较奇葩,利用chardet获取网页编码,然后在BeautifulSoup构造器中传入from_encoding=参数,获取的还是一堆乱码; 无
阅读全文
摘要:Python3.x与Python2.x的区别 Python3自带了一个2to3的实用脚本.这个脚本会将python2程序源文件作为输入,然后自动转换到python3.但并不是所有内容都可以自动转换。 python3与python2区别: 1,print语句 python2中print是一个语句,不论
阅读全文
摘要:Python3.x:打包为exe执行文件(window系统) window系统下发布: 一、安装pyinstaller(PyInstaller 3.3.1) cmd安装命令: 二、python程序打包(不带参数) 文件命名规范:不支持中文命令的python文件; 路径:建议路径中不带中文目录; 命令
阅读全文
摘要:Python3.x:常用基础语法 1,if else语句: 不执行if内的语句,需要用:pass 2,日期转字符: 3,字符转日期: 4,日期、时间比较: 5,获取当前日期: 6,类定义、数组定义以及赋值: 7,三目运算: 8,去掉字符串中空格: 9,命令行参数使用(传递多个参数,参数之间用空格隔开
阅读全文
摘要:Python3.x:定义一个类并且调用 1,定一个类Shrjj(其中有属性:name, jjzt,fbsjj,etf,lof,fjlof): 2,调用Shrjj类: 3,运行结果: 4,可以定义可变参数类(参数个数不固定):
阅读全文
摘要:Python3.x:BeautifulSoup()解析网页内容出现乱码 问题: 出现乱码; 解决方案: 将BeautifulSoup(start_html.text, "html.parser")替换为BeautifulSoup(start_html.content, "html.parser"),
阅读全文
摘要:Django框架搭建(windows系统) 一、Django简介 开放源代码的Web应用框架,由Python语言编写,一个大而全的框架。 1.web框架介绍 具体介绍Django之前,必须先介绍WEB框架等概念。 web框架: 别人已经设定好的一个web网站模板,你学习它的规则,然后“填空”或“修改
阅读全文
摘要:Python3.x:正则 re.findall()的用法 概念: 语法:findall(pattern, string, flags=0) 说明:返回string中所有与pattern相匹配的全部字串,返回形式为数组) 示例: 对于上述示例中的代码可以改装(更加合理的编码行为),就拿示例4来改装:
阅读全文
摘要:Python3.x:python: extend (扩展) 与 append (追加) 的区别 1,区别: append() 方法向列表的尾部添加一个新的元素。只接受一个参数; extend()方法只接受一个列表作为参数,并将该参数的每个元素都添加到原有的列表中; 2,示例: 作者:整合侠链接:ht
阅读全文
摘要:Python3.x:zip()函数 1,概述: zip函数接受任意多个(包括0个和1个)序列作为参数,返回一个tuple列表; 2,示例: (1).示例1: (2).示例2: (3).示例3: (4).示例4: (5).示例5: 注意:Python3.x和Python2.x差别; 作者:整合侠链接:
阅读全文
摘要:Python3.x:获取代理ip以及使用 python爬虫浏览器伪装 设置代理 同时设置用代理和模拟浏览器访问 获取代理ip 常用的代理ip地址: 1,西刺免费代理IP:http://www.xicidaili.com/ 2,国内高匿代理IP:http://www.xicidaili.com/nn/
阅读全文
摘要:Python3.x:报错POST data should be bytes, an iterable of bytes 问题: python3.x:报错 原因: 其中的data需要转为utf-8 解决方案:
阅读全文
摘要:Python3.x:chrome运行webdriver脚本提示--ignore-certificate-errors 1,分析原因: 根本原因是Chromedriver和Chrome的版本不兼容; 网上很多方案说加上如下代码可以解决,但是我试过了Chromedriver和Chrome的版本不兼容加上
阅读全文