摘要: BeautifulSoup 使用BeautifulSoup来解析html页面 import requests url = "https://python123.io/ws/demo.html" # 1. 使用requests库 r = requests.get(url) demo = r.text 阅读全文
posted @ 2021-02-19 15:00 sxhyyq 阅读(39) 评论(0) 推荐(0) 编辑
摘要: Robots协议 全称网络爬虫排除标准。 作用:告知网络爬虫哪些页面可以爬取,哪些不可以。 形式:在网络根目录下的robots.txt文件。 Ex.查看京东网站的robots.txt文件 Robots协议的使用 爬虫应该自动识别robots.txt文件,再进行内容爬取。 实战 实战1 --京东商品 阅读全文
posted @ 2021-02-18 16:34 sxhyyq 阅读(102) 评论(0) 推荐(0) 编辑
摘要: Requests库入门 使用pip install requests安装包,然后使用import requests来导入包。 Ex. import requests r = requests.get("http://www.baidu.com") print(r.status_code) # 200 阅读全文
posted @ 2021-02-16 15:40 sxhyyq 阅读(27) 评论(0) 推荐(0) 编辑
摘要: 一道简单的题目,车厢重组 题目描述 在一个旧式的火车站旁边有一座桥,其桥面可以绕河中心的桥墩水平旋转。一个车站的职工发现桥的长度最多能容纳两节车厢,如果将桥旋转180度,则可以把相邻两节车厢的位置交换,用这种方法可以重新排列车厢的顺序。于是他就负责用这座桥将进站的车厢按车厢号从小到大排列。他退休后, 阅读全文
posted @ 2021-02-15 10:51 sxhyyq 阅读(50) 评论(0) 推荐(0) 编辑
摘要: 链接 数的计算 题目 我们要求找出具有下列性质数的个数(包含输入的正整数 \(n\))。 先输入一个正整数 \(n(n \le 1000)\),然后对此正整数按照如下方法进行处理: 不作任何处理; 在它的左边加上一个正整数,但该正整数不能超过原数的一半; 加上数后,继续按此规则进行处理,直到不能再加 阅读全文
posted @ 2021-02-14 15:34 sxhyyq 阅读(255) 评论(0) 推荐(0) 编辑
摘要: 类的赋值与深浅拷贝 类的赋值 实际上指向的还是同一对象,只是用两个变量来表示。 class A: pass a = A() b = a print(a is b) #### True 浅拷贝 Python拷贝一般都是浅拷贝。 class Cpu: pass class Disk: pass clas 阅读全文
posted @ 2021-02-08 15:40 sxhyyq 阅读(39) 评论(0) 推荐(0) 编辑
摘要: 类的创建 语法 class 类名: pass 类名由一个或多个字母组成,首字母大写,其他字母小写。 直接写在类里的变量,成为类属性。 在类里定义的函数,成为类方法。 class Student: name = '张三' # 类属性 def eat(self): # 实例方法 print(self.n 阅读全文
posted @ 2021-02-06 14:29 sxhyyq 阅读(55) 评论(0) 推荐(0) 编辑
摘要: 异常处理 Python提供了异常处理机制,可以在异常出现时及时捕获,并且进行处理。 单个except结构 try: a = int(input('请输入第一个整数: ')) b = int(input('请输入第二个整数: ')) result = a / b print('结果是', result 阅读全文
posted @ 2021-02-05 13:45 sxhyyq 阅读(40) 评论(0) 推荐(0) 编辑
摘要: 字符串的比较 比较运算符<、<=、>、>=、==、!= 比较规则按字典序比较。 s = "abc" s2 = "abcd" print(s < s2) # True print(s <= s2) # True print(s > s2) # False print(s >= s2) # False 阅读全文
posted @ 2021-02-04 14:01 sxhyyq 阅读(66) 评论(0) 推荐(0) 编辑
摘要: 字符串 是Python中的基本数据类型,是不可变序列。 字符串的查询 index()方法 可以设置start和end,范围是[start,end) 查找子串第一次出现的位置,若不存在,抛出ValueError。 s = "hello world!" p1 = s.index('llo') print 阅读全文
posted @ 2021-02-04 12:24 sxhyyq 阅读(40) 评论(0) 推荐(0) 编辑