001 Python网络爬虫与信息提取 课程前序
[A] 主要课程内容
1. 学习 Requests 库:自动爬取HTML页面,自动发送完网络请求
2. 学习 robots.txt :网络爬虫排除标准
3. 学习 Becautiful Soup 库:能很好的解析HTML页面,并且提取相关信息
4. 实战项目A/B Projects
5. 学习正则表达式库 Re:正则表达式详解,提取页面关键信息
6. 学习网络爬虫框架 Scrapy:网络爬虫原理介绍,专业爬虫框架介绍
[B] 内容组织
12个单元:8个内容单元 + 4个实例单元
[C] 常见 Python IDE工具
文本类工具 IDE: IDEL 和 Sublime Text
集成工具类 IDE: Pycharm,Anaconda $ Spyder