第 14 节 爬虫(2)
from urllib.request import urlopen
#urLLib相关与URL处理的包管理器
url "http://photo.sina.com.cn/"
con urlopen(url)
print('------')
print(con.read())
cons =con.read()
f open('test.html','wb')
f.write(cons)
f.close()
print(cons.decode('utf-8'))
open
核心:创建一个file对象python的I/0
open(namel,model,buffering]])
buffering:设置缓冲
encoding:一般使用utf8
errors:报错级别
newline:区分换行符
closefd:传入的file参数类型
opener:设置自定义开启器,开启器的返回值必须是一个打开的文件描述符
使用方式直接向上:
1、关于name:想访问的文件名
2、mode:决定打开的模式
m0d->w:只用于写入如果文件存在,则直接打开,并从头进行编辑,进行原覆盖(别了重来),如果没有这个文件,他就会创建一个新的
mode->wb:以二进制格式打开(一般用于非文本文件)
urLLib主要作用:操作网页URL
llib.request.urlopen(url,data=None,[timeout,]*cafile-None,capath=None,cadefault=False,context=None)
url:url地址。
data:发送到服务器的其他数据对象,默认为None。timeout:设置访问超时时间。
cafile和capath:cafile勇CA证书,capath为CA证书的路径,使用HTTPS需要用到。
cadefault:已经被弃用。
context:ssL.SSLContext类型,用来指定SSL设置。
read():主要用于读取网页的内容
python文件操作:
对于Excel的操作需要引入openpyxlfile对象属性:
closed告诉结果:文件是否被关闭,如果关闭成功返回true、else-》false
f =open('text.html','wb')
f.closed
f.mode
f.name
f.softspace
如果需要做一些文件外部操作:
如果想要rename->你需要去引入os
【推荐】国内首个AI IDE,深度理解中文开发场景,立即下载体验Trae
【推荐】编程新体验,更懂你的AI,立即体验豆包MarsCode编程助手
【推荐】抖音旗下AI助手豆包,你的智能百科全书,全免费不限次数
【推荐】轻量又高性能的 SSH 工具 IShell:AI 加持,快人一步
· 分享4款.NET开源、免费、实用的商城系统
· 全程不用写代码,我用AI程序员写了一个飞机大战
· MongoDB 8.0这个新功能碉堡了,比商业数据库还牛
· 白话解读 Dapr 1.15:你的「微服务管家」又秀新绝活了
· 上周热点回顾(2.24-3.2)
2017-10-28 react-native 完整实现登录功能
2013-10-28 MySQL InnoDB数据库备份与还原
2013-10-28 FTP上传文件时 System.Net.WebException: 基础连接已经关闭: 接收时发生错误。