摘要:
requests 的底层实现其实就是 urllib json在线解析工具 Linux alias命令用于设置指令的别名。 home目录中~/.bashrc 这个文件主要保存个人的一些个性化设置,如命令别名、路径等。 注意:1,写绝对路径 2,有空格 改好后使用source ~/.bashrc 使用文 阅读全文
摘要:
爬虫的分类:聚焦爬虫和通类爬虫- 微指数-新浪 robots.txt Robots协议:网站通过Robots协议告诉搜索引擎哪些页面可以抓取,哪些页面不能抓取。 爬虫的概念 爬虫是模拟浏览器发送请求,获取响应 爬虫是模拟浏览器发送请求,获取响应 爬虫的流程 url >发送请求,获取响应 >提取数据 阅读全文
摘要:
bytes 1、bytes对象只负责以二进制字节序列的形式记录所需记录的对象,至于该对象到底表示什么(比如到底是什么字符)则由相应的编码格式解码所决定 2、bytes是Python 3中特有的,Python 2 里不区分bytes和str。 3、python3中: str 使用encode方法转化为 阅读全文