Ubuntu下配置python完成爬虫任务(笔记一)
Ubuntu下配置python完成爬虫任务(笔记一)
目标:
作为一个.NET汪,是时候去学习一下Linux下的操作了。为此选择了python来边学习Linux,边学python,熟能生巧嘛。
前期目标是完成环境配置,apt的简单操作。
之后按照网上的文档学习一下python的操作,顺便用python写爬虫功能。由于有用C#写爬虫的底子,应该能少走许多弯路。
再接下来,就安装配置一下redis,用python读写一下redis。最后小程序跑起来。这个初级学习过程就算结束了。【15Day】
正文:
首先登陆系统:
我这里是虚拟机集群服务器上的一个Ubuntu学习用虚拟机。
我在window上用Xshell 5来远程登陆Ubuntu。
登陆看看,关于Ubuntu的配置,就不介绍了,网文很多,不是这里话题点。
查看一下python的版本:
python --version
好了,看到这里是2.7.6版本的python。
接下来通过urllib2这个包来写一个读取网页的小例子:
首先导入urllib2:
import urllib2
在这一步,若是导入失败,提示没有urllib2,我们就去安装一下。
在ubuntu下有apt-get这个包管理器,使用起来巨方便的,通过这个东西来导入urllib2
键入搜索命令:
apt-cache search urllib2
这个命令会显示所有urllib2关键字的包,并且后面写了简单的说明,根据需要进行安装即可。
安装完成后,继续coding!
回到导入urllib2的步骤,然后继续读取一个页面,例如政府首页。
page = urllib2.urlopen("http://www.gov.cn/")
然后读取内容。
page = urllib2.urlopen("http://www.gov.cn/")
打印,看看内容:
回车后,发现html内容已经读取出来了。
小测试写到这里。
作者:Li keli
出处:https://www.cnblogs.com/likeli/p/5280540.html
本站使用「署名 4.0 国际」创作共享协议,转载请在文章明显位置注明作者及出处。
【推荐】国内首个AI IDE,深度理解中文开发场景,立即下载体验Trae
【推荐】编程新体验,更懂你的AI,立即体验豆包MarsCode编程助手
【推荐】抖音旗下AI助手豆包,你的智能百科全书,全免费不限次数
【推荐】轻量又高性能的 SSH 工具 IShell:AI 加持,快人一步
· 如何编写易于单元测试的代码
· 10年+ .NET Coder 心语,封装的思维:从隐藏、稳定开始理解其本质意义
· .NET Core 中如何实现缓存的预热?
· 从 HTTP 原因短语缺失研究 HTTP/2 和 HTTP/3 的设计差异
· AI与.NET技术实操系列:向量存储与相似性搜索在 .NET 中的实现
· 周边上新:园子的第一款马克杯温暖上架
· Open-Sora 2.0 重磅开源!
· 分享 3 个 .NET 开源的文件压缩处理库,助力快速实现文件压缩解压功能!
· Ollama——大语言模型本地部署的极速利器
· DeepSeek如何颠覆传统软件测试?测试工程师会被淘汰吗?