Python 用POP接收邮件

一、简介
　　POP(Post Office Protocal)最长用的POP版本是POP3，因此本文是以POP3为主。POP3非常简单，可以用来从邮件服务器上下载邮件，然后删除这些邮件。功能非常有限，后面讲解的IMAP完胜它，不过作为入门级的，还是有必要介绍一下，也对学习SMTP有帮助。
　　Python提供了poplib模块，它提供了使用POP的便利接口。
二、实例
　　由于pop3功能较IMAP非常有限，而且我最后的程序并没有使用pop3，所以，不详细讲解，下面通过一个例子来说明下较为常见的功能。
　　这个例子的功能为进入邮箱，查看所有的邮件。首先显示邮件的发件人、主题，查看邮箱主题内容。
1. 需要模块

import email, poplib, sys

2. 连接POP3服务器，登录个人邮箱账户
　　poplib提供POP3()方法和POP3_SSL()方法连接POP3服务器，区别和SMTP一样。gmail仍然使用POP3_SSL()方式，并返回class POP3实例

p = poplib.POP3_SSL('pop.gmail.com')

　　使用POP3.user(), POP3.pass_()方法来登录个人账户

try:
    p.user(user) 
    p.pass_(passwd)
except poplib.error_proto: #可能出现的异常
    print('login failed')

3. 现在已经进入个人账户，下一步，利用POP3.list()函数查看邮箱内邮件信息。

　　关于list()函数的详细说明，请点击这里。
list()函数有三个返回值，分别是：response, listings, octets

response 应答信息，我测试中出现的结果：

　　以b开头的字符串是Byte类型，我在实际测试的时候，返回的信息几乎都是Byte类型的。关于此类型及和普通字符串的转化会在后面举例说明。

listings 是形如['message_id message_size',...]若干各message-id和message_size构成的list。后面就是通过message_id来检索邮件。我测试中出现的结果：

octets 不是特别清楚啥意思。

response, listings, octets = p.list()

4. 最重要的就是listings数据

　　如上面解释的，listings是个list类型的数据，接下来我们取出listings中的message_id，也就是上面的 "1" "2" "3" "4" ...

for listing in listings: #每次需要一个listing
number, size = listing.split() #由于number和size是以空格分隔，所以利用split()函数分开，split()默认以' '为分隔

　　现在我们就取出了我们需要的message_id，也就是number，注意number需要从Byte类型转化为字符串类型。

5. POP3.top()函数

　　利用此函数，取出邮件的headers，如下：

response, lines, octets = p.top(number , 0)

　　lines存储内容，下面先转化成Message类型（lines默认为标准字符串类型，仅供说明，以实际代码为准）

message = email.message_from_string('\n'.join(lines))

6. 已经生成Message类，可以利用头部信息来查看From, Subject等信息

for header in 'From', 'To', 'Subject', 'Date':
    if header in message:
        print(header + ':' , message[header])

　　注意，此时的message[header]可能不会输出我们想看到的内容，有可能出现格式错乱问题，比如中英文的转化，所以还需要特殊来处理。处理方式请继续往下看IMAP部分。

7. 取出邮件所有信息
　　上面的top()函数只取出header信息以及根据参数确定的n行内容，如果用户希望查看邮件所有内容，那利用POP3.retr()函数取出

response, lines, octets = p.retr(number)

　　还是将lines中的内容转换成Message类型：

message = email.message_from_string('\n'.join(lines))

8. 已经有了邮件所有信息，可以通过Message.get_payload()取出邮件正文了。

　　但是，get_payload()函数并不一定返回邮件正文。以下是官方说明：
Return the current payload, which will be a list of Message objects when is_multipart() is True, or a string when is_multipart() is False.
　　在实际测试中，返回的就是a list of Message objects，这个问题困扰我很长时间，最终还是解决了，通过以下方法：

maintype = message.get_content_maintype()
if maintype == 'multipart':
    for part in message.get_payload():
        if part.get_content_maintype() == 'text':
            mail_content = part.get_payload(decode=True).strip()
elif maintype == 'text':
    mail_content = e.get_payload(decode=True).strip()

9. 此时，mail_content就是邮件正文了.

　　当然，如果是中文的话，这件事仍未完，还需要将它转化未'gbk'，利用如下方式：

mail_content = mail_content.decode('gbk')

10. 到现在，基本已经大功告成了，能够取出邮箱中所有的邮件，并查看邮件的header内容和邮件正文了^_^
三、完整代码：

#-*- encoding:utf-8 -*-
#-*- encoding:gbk -*-

import email, getpass, poplib, sys

hostname = 'pop.gmail.com'
user = 'myUserName@gmail.com'
passwd = '***'

p = poplib.POP3_SSL('pop.gmail.com') #与SMTP一样，登录gmail需要使用POP3_SSL() 方法，返回class POP3实例
try:
    # 使用POP3.user(), POP3.pass_()方法来登录个人账户
    p.user(user) 
    p.pass_(passwd)
except poplib.error_proto: #可能出现的异常
    print('login failed')
else:
    response, listings, octets = p.list()
    for listing in listings:
        number, size = listing.split() #取出message-id
        number = bytes.decode(number) 
        size = bytes.decode(size) 
        print('Message', number, '( size is ', size, 'bytes)')
            print()
        response, lines, octets = p.top(number , 0)
        # 继续把Byte类型转化成普通字符串
        for i in range(0, len(lines)):
            lines[i] = bytes.decode(lines[i])
        #利用email库函数转化成Message类型邮件
        message = email.message_from_string('\n'.join(lines))
        # 输出From, To, Subject, Date头部及其信息
        for header in 'From', 'To', 'Subject', 'Date':
            if header in message:
            print(header + ':' , message[header]) 
        #与用户交互是否想查看邮件内容
        print('Read this message [ny]')
        answer = input()
        if answer.lower().startswith('y'):
            response, lines, octets = p.retr(number) #检索message并返回
            for i in range(0, len(lines)):
                lines[i] = bytes.decode(lines[i])
            message = email.message_from_string('\n'.join(lines)) 
            print('-' * 72)
            maintype = message.get_content_maintype()
            if maintype == 'multipart':
                for part in message.get_payload():
                    if part.get_content_maintype() == 'text':
                mail_content = part.get_payload(decode=True).strip()
            elif maintype == 'text':
                mail_content = e.get_payload(decode=True).strip()
            try:
                mail_content = mail_content.decode('gbk')
            except UnicodeDecodeError:
                print('Decoding to gbk error')
                sys.exit(1)
            print(mail_content)
        print()
        print('Delete this message? [ny]')
        answer = input()
        if answer.lower().startswith('y'):
            p.dele(number)
            print('Deleted')
finally:
    print('log out')
    p.quit()

posted @ 2013-11-01 21:39 viczzx 阅读(5815) 评论(0) 编辑收藏举报

刷新页面返回顶部

viczzx

Positive Active Enthusiastic Deticated

Python 用POP接收邮件

公告