摘要: # 正则表达式 ### 应用场景 - 特定规律字符串的查找,切割、替换等 - 特定格式(邮箱、手机号、IP、URL等)的校验 - 爬虫项目中,提取特定内容 ### 使用原则 - 只要使用字符串函数能够解决的问题就不要使用正则 - 正则的效率比较低,同时会降低代码的可读性 - 世界上最难理解的三样东西:医生的处方、道士的神符、码农的正则 - 提醒:正则是用来写的,不是用来读的;在不清楚功能... 阅读全文
posted @ 2018-12-22 17:59 青春叛逆者 阅读(215) 评论(0) 推荐(0) 编辑
摘要: 解决方法如图: 阅读全文
posted @ 2018-12-22 12:25 青春叛逆者 阅读(1870) 评论(0) 推荐(0) 编辑
摘要: #下载网页 #具有功能:捕获异常,重试下载并设置用户代理 import urllib.request import urllib.error #下载网页 #wscp:默认用户代理 web scraping with python 缩写 def download(url, user_agent='wscp',num_retries=2): print('Downloading:',url)... 阅读全文
posted @ 2018-12-22 11:43 青春叛逆者 阅读(284) 评论(0) 推荐(0) 编辑
摘要: #下载网页 import urllib.request import urllib.error #下载网页 def download(url, num_retries=2): print('Downloading:',url) #打印下载路径 try: html=urllib.request.urlopen(url).read() except urlli... 阅读全文
posted @ 2018-12-22 11:22 青春叛逆者 阅读(739) 评论(0) 推荐(0) 编辑
摘要: 下面提供一个实例,帮助大家理解: 阅读全文
posted @ 2018-12-22 11:01 青春叛逆者 阅读(26104) 评论(0) 推荐(2) 编辑
摘要: pip install builtwit 该模块将URL作为参数,下载该URL并对其进行分析,然后返回该网站使 用的技术。下面是使用该模块的-一个例子。 import builtwith builtwith.parse('http://example.webscraping.com') {'web-servers': ['Nginx'], 'web-frameworks': ['Web2py'... 阅读全文
posted @ 2018-12-22 10:21 青春叛逆者 阅读(374) 评论(0) 推荐(0) 编辑
摘要: 一个字符,那就可以用“”括起来,比如"T'm OK"包含的字符是I, ',m,空格,O, K这6个 字符。 如果字符串内部既包含’又包含"怎么办?可以用转义字符\来标识,比如: 'I\'m \"OK\"!' 表示的字符串内容是: I'm "OK"! 转义字符\可以转义很多字符,比如\n表示换行,\t 表示制表符,字符\本身也要转义,所以 \\表示的字符就是\,可以在Python的交互式命令行用p... 阅读全文
posted @ 2018-12-22 09:34 青春叛逆者 阅读(441) 评论(0) 推荐(0) 编辑
摘要: # HTML入门 ### C/S与B/S架构 - C/S架构 - client:客户端 - server:服务器 - B/S架构 - browser:浏览器 - server:服务器 ### WEB工作原理 - 浏览器 => 服务器:发送请求,索取相关数据。 - 服务器 => 浏览器:接收请求并解析,处理业务,返回数据(响应) - 页面组成:HTML、CSS、JS ##... 阅读全文
posted @ 2018-12-22 09:08 青春叛逆者 阅读(785) 评论(0) 推荐(0) 编辑
摘要: 事件冒泡 阅读全文
posted @ 2018-12-22 09:05 青春叛逆者 阅读(272) 评论(0) 推荐(0) 编辑
摘要: 轮播效果 > #写你自己的图片路径就可以了 阅读全文
posted @ 2018-12-22 09:04 青春叛逆者 阅读(867) 评论(0) 推荐(0) 编辑