摘要:
Python3.x:Linux下退出python命令行 退出命令: 阅读全文
摘要:
Python3.x:ConfigParser模块的使用 简介 ConfigParser模块在python中是用来读取配置文件,配置文件的格式跟windows下的ini配置文件相似,可以包含一个或多个节(section),每个节可以有多个参数(键=值)。 使用的配置文件的好处就是不用再程序中硬编码,可 阅读全文
摘要:
Python3.x:SQLAlchemy操作数据库 前言 SQLAlchemy是一个ORM框架(Object Rational Mapping,对象关系映射),它可以帮助我们更加优雅、更加高效的实现数据库操作,而且还不限于mysql。 SQLAlchemy本身无法操作数据库,其必须以来pymsql等 阅读全文
摘要:
Python3.x:遍历select下拉框获取value值 Select提供了三种选择方法: Select提供了四种方法取消选择: Select提供了三个属性方法给我们必要的信息: 示例一:代码(selenium遍历select选项列表): 示例二:代码(BeautifulSoup遍历select选 阅读全文
摘要:
Python3.x:Selenium中的webdriver进行页面元素定位 页面上的元素就像人一样,有各种属性,比如元素名字,元素id,元素属性(class属性,name属性)等等。webdriver就是利用元素的这些属性来进行定位的。 可以用于定位的常用的元素属性: id name class n 阅读全文
摘要:
Python3.x:selenium获取iframe内嵌页面的源码 前言 在一些网页中经常会看到ifrmae/frame标签,iframe是嵌入式框架一般用来在已有的页面中嵌入另一个页面,当一个元素在iframe里时我们应该先切换到iframe里面。 语法 1.进入iframe 2.释放/退出ifr 阅读全文
摘要:
Python3.x:Selenium+PhantomJS爬取带Ajax、Js的网页 前言 现在很多网站的都大量使用JavaScript,或者使用了Ajax技术。这样在网页加载完成后,url虽然不改变但是网页的DOM元素内容却可以动态的变化。如果处理这种网页是还用requests库或者python自带 阅读全文
摘要:
Python3.x:pytesseract识别率提高(样本训练) 1,下载并安装3.05版本的tesseract 地址:https://sourceforge.net/projects/tesseract-ocr/ 2,如果你的训练素材是很多张非tif格式的图片,首先要做的事情就是将这么图片合并(个 阅读全文