随笔分类 - Python
摘要:CSDN 的爬取比较简单,没有知乎那种反爬虫需要 ip 代理模拟登录那么麻烦。在确认一个用户之后,找到目录的 url,再通过 css 选择器找到每一篇博客的 url 再分别保存为 markdown 格式。 ```python import requests import parsel import
阅读全文
摘要:爬虫分为四个步骤,首先获取数据,然后解析数据,再提取数据,最后是存储数据 ```python import requests #首先引入requests库 res=requests.get('URL')#向服务器发送了一个请求,把服务器响应结果赋给res,为response对象 res.encodi
阅读全文
摘要:### 数据类型 #### 字符串:双引号或者单引号引起来的文本 字符串内字符都有序号,正向是从 0 开始,反向是-1 开始。str[-1]指的就是最后一个字符。 字符串的拼接: 1. - 号,对于字符串或者非字符串使用该符号就能拼接成一个字符串。 2. .format(),中间的参数,对应字符串中
阅读全文