2019 年 7月随笔档案 - Luna彬

Re（正则表达式）库入门

摘要：一、正则表达式的概念正则表达式 "一行胜千言" regular expression regex RE 是用来简洁表达一组字符串的表达式。 'PN' 'PYN' 'PYTN' < >正则表达式：P(Y|YT|YTH|YTHO)?N 'PYTHN' 'PYTHON' 通用的字符串表达框架是用来简洁阅读全文

posted @ 2019-07-27 16:16 Luna彬阅读(6082) 评论(0) 推荐(0)

基于bs4库的HTML内容查找方法

摘要：一、信息提取实例提取HTML中所有的URL链接思路：1）搜索到所有的<a>标签 2）解析<a>标签格式，提取href后的链接内容 >>> import requests>>> r= requests.get("https://python123.io/ws/demo.html")>>> demo 阅读全文

posted @ 2019-07-25 09:53 Luna彬阅读(1152) 评论(0) 推荐(0)

Beautiful Soup库

摘要：Beautiful Soup：美味汤非常优秀的python第三方库能够对html、xml格式进行解析，并且提取其中的相关信息 Beautiful Soup可以对你提供给他的任何格式进行相关的爬取，并且可以进行树形解析使用原理：把任何你给他的文档当成一锅汤，然后煲制这锅汤一、安装： pip3 阅读全文

posted @ 2019-07-23 10:10 Luna彬阅读(230) 评论(0) 推荐(0)

Requests库网络爬虫实战

摘要：实例一：页面的爬取 >>> import requests>>> r= requests.get("https://item.jd.com/100003717483.html")>>> r.status_code200>>> r.encoding#说明从HTTP的头部分，已经可以解析出这个页面的编码阅读全文

posted @ 2019-07-17 14:33 Luna彬阅读(541) 评论(0) 推荐(0)

python入门（二十一）：基于文件的接口自动化框架

该文被密码保护。

posted @ 2019-07-10 10:15 Luna彬阅读(6) 评论(0) 推荐(0)

python进阶（十七）正则&json（上）

摘要：1. 一个列表中所有的数字都是重复2次，但是有一个数字只重复了一次。请找出重复一次的数字，不可以使用内置函数。 [2,2,1,1,0,4,3,4,3] 方法1：通过字典计数，找到value等于1的key s = [2,2,1,1,0,4,3,4,3] m = {} for i in s: if i 阅读全文

posted @ 2019-07-08 17:15 Luna彬阅读(545) 评论(0) 推荐(0)

python进阶（十七）xml（下）

摘要：1、XML简介 xml用到的地方：tomcat配置文件 1) xml 指可扩展标记语言(Extensible Markup Language) 2) xml 被设计用于结构化、存储和传输数据 3) xml 是一种标记语言，很类似于HTML 4) xml 没有像HTML那样具有预定义标签，需要程序员自阅读全文

posted @ 2019-07-08 16:51 Luna彬阅读(502) 评论(0) 推荐(0)

07 2019 档案