随笔分类 - python
摘要:#!/usr/bin/python3 #利用字符串的maketrans()方法和translate()方法实现加密解密 加密程序 key= '1234567890_*?&^%(_)+$#@!~`!' value='abcdefghijklmnx_opqrstuvwyz' str=input("请输入
阅读全文
摘要:import smtplib from email.mime.text import MIMEText from email.mime.multipart import MIMEMultipart from email.mime.image import MIMEImage #切记,文件图片传送都用
阅读全文
摘要:一、smtplib模块: 主要通过SMTP类与邮件系统进行交互。使用方法如下: 1.实例化一个SMTP对象: s = smtplib.SMTP(邮件服务地址,端口号) s = smtplib.SMTP_SSL(邮件服务地址,端口号) 2.登陆邮件,权限验证: s.login(用户名,密码) 3.发送
阅读全文
摘要:#python实现发送邮件带附件 from email.mime.text import MIMEText from email.mime.multipart import MIMEMultipart import smtplib #创建一个带附件的实例 msg = MIMEMultipart()
阅读全文
摘要:1 #邮件发送方 qq邮箱服务器:pop.qq.com 端口号:smtp协议用的465端口 2 #邮件内容 3 #邮件接收方 4 #准备条件 授权码 获取很简单百度即可 授权码,是为了,防止邮箱密码泄露 5 #发送邮件作用 可以嵌入程序中,当触发条件,发送邮件 6 import smtplib 7
阅读全文
摘要:项目截图:布局,pani.py是发spider请求的文件主要写这个 pipelines.py是管道文件:用来存储爬取的数据 items.py是字段文件:用来定义爬取的字段 注意:在使用管道时一定要配置管道的优先级 eg:配置截图如下(照着来就行,把‘#’注释掉就行) 创建项目:之类的见,博客前面有详
阅读全文
摘要:使用yield关键字,好处大大胜于return, 因为yield返回的不是序列,而是一个生成器对象,next()接受,可以实现边生成数值,边传送处理,而return 只能等所有数据都取完,才能处理,效率有跟大差异。 一般可以用在parse 方法里面代替return 方法·给piplines.py返回
阅读全文
摘要:需求:闲来无聊,想看小说,但是想下载下来,于是开始准备爬虫。 1.创建项目(命令是在命令行里面执行的) scrapy startproject text #创建一个名字为text的scrapy项目
阅读全文
摘要:1.scrapy框架使用步骤 快捷键 shift+鼠标右键 可以直接在文件夹处打开powershell,从而指令命令 1.创建scrapy项目 命令:scrapy startproject 爬虫名 2.明确要爬取的目标 在items.py文件里面定义要爬取的字段 3.制作爬虫 命令:scrapy g
阅读全文
摘要:https://www.jb51.net/article/169088.htm
阅读全文
摘要:方法:被引用的文件名不能是数字开头的 其次,引用时不能加后缀.py
阅读全文
摘要:https://www.cnblogs.com/it-tsz/p/8899161.html
阅读全文
摘要:https://www.jianshu.com/p/8e78dfa7c368
阅读全文
摘要:requests对象的get和post方法都会返回一个Response对象,这个对象里面存的是服务器返回的所有信息,包括响应头,响应状态码等。其中返回的网页部分会存在.content和.text两个对象中。 两者区别在于,content中间存的是字节码,而text中存的是Beautifulsoup根
阅读全文
摘要:1. Beautiful Soup的简介 简单来说,Beautiful Soup是python的一个库,最主要的功能是从网页抓取数据。官方解释如下: Beautiful Soup提供一些简单的、python式的函数用来处理导航、搜索、修改分析树等功能。它是一个工具箱,通过解析文档为用户提供需要抓取的
阅读全文
摘要:https://blog.csdn.net/weixin_42105064/article/details/80151587
阅读全文
摘要:python爬虫入门(四)利用多线程爬虫 多线程爬虫 先回顾前面学过的一些知识 1.一个cpu一次只能执行一个任务,多个cpu同时可以执行多个任务2.一个cpu一次只能执行一个进程,其它进程处于非运行状态3.进程里包含的执行单元叫线程,一个进程可以包含多个线程4.一个进程的内存空间是共享的,每个进程
阅读全文
摘要:python爬虫入门(三)XPATH和BeautifulSoup4 XML和XPATH 用正则处理HTML文档很麻烦,我们可以先将 HTML文件 转换成 XML文档,然后用 XPath 查找 HTML 节点或元素。 XML 指可扩展标记语言(EXtensible Markup Language) X
阅读全文