摘要: 最简单的理解就是这样: __name__ 是当前模块名,当模块被直接运行时,模块名为 __main__。 所以 if __name__ == '__main__' 这句话的意思就是当前模块被直接运行时,以下代码将被执行, 当模块是被其它程序导入时,代码块不会被执行。 1️⃣ 举例分析 第一步,新建一 阅读全文
posted @ 2018-06-03 19:04 暮光微凉 阅读(6607) 评论(0) 推荐(1) 编辑
摘要: 主要内容: 一、基础爬虫框架的三大模块 二、完整代码解析及效果展示 1️⃣ 基础爬虫框架的三大模块 1、HTML下载器:利用requests模块下载HTML网页。 2、HTML解析器:利用re正则表达式解析出有效的数据。 3、数据存储器:将有效数据通过文件或者数据库的形式存储起来。 2️⃣ 完整代码 阅读全文
posted @ 2018-06-03 16:52 暮光微凉 阅读(710) 评论(0) 推荐(0) 编辑