摘要: 论一只爬虫的自我修养 URL的一般格式(带括号[]的为可选项): protocol://hostname[:port]/path/[;parameters][?query]#fragment URL由三部分组成: 第一部分是协议: http、https、ftp、file、ed2k.... 第二部分是 阅读全文
posted @ 2017-09-17 15:43 douzujun 阅读(333) 评论(0) 推荐(0) 编辑
摘要: 收取邮件就是编写一个MUA作为客户端,从MDA把邮件获取到用户的电脑或者手机上。收取邮件最常用的协议是POP协议,目前版本号是3,俗称POP3。 Python内置一个poplib模块,实现了POP3协议,可以直接用来收邮件。 注意到POP3协议收取的不是一个已经可以阅读的邮件本身,而是邮件的原始文本 阅读全文
posted @ 2017-09-17 00:01 douzujun 阅读(2557) 评论(0) 推荐(0) 编辑