摘要: Python爬虫入门笔记 来源:blog.csdn.net/weixin_44864260 爬虫四大步骤: 1.获取页面源代码 2.获取标签 3.正则表达式匹配 4.保存数据 1. 获取页面源代码 5个小步骤:1.伪装成浏览器2.进一步包装请求3.网页请求获取数据4.解析并保存5.返回数据 代码: 阅读全文
posted @ 2020-11-15 13:46 程绩 阅读(171) 评论(0) 推荐(0) 编辑
摘要: 一、web服务器的简介 网页服务器(Web server)一词有两个意思: 一台负责提供网页的电脑,主要是各种编程语言构建而成,通过HTTP协议传给客户端(一般是指网页浏览器)。 一个提供网页的服务器程序 二、web服务器的简单搭建 1、安装一个可以提供web服务的软件 yum -y install 阅读全文
posted @ 2020-11-15 12:33 程绩 阅读(2477) 评论(0) 推荐(0) 编辑