邮件传输协议笔记
SMTP协议
SMTP协议中一共规定了18条命令,发送一封电子邮件的过程通常只需要其中的6条命令即可,下表按照发送命令的先后顺序列出了这6条命令,并描述了其语法及功能说明,其中,
SMTP命令格式 | 说明 |
---|---|
ehlo |
ehlo命令是SMTP邮件发送程序与SMTP邮件接收程序建立连接后必须发送的第一条SMTP命令,参数 |
auth |
如果SMTP邮件接收程序需要SMTP邮件发送程序进行认证时,它会向SMTP邮件发送程序提示它所采用的认证方式,SMTP邮件发送程序接着应该使用这个命令回应SMTP邮件接收程序,参数 |
mail |
此命令用于指定邮件发送者的邮箱地址,参数 |
rcpt |
此命令用于指定邮件接收者的邮箱地址,参数 |
data |
此命令用于表示SMTP邮件发送程序准备开始输入邮件内容,在这个命令后面发送的所有数据都将被当做邮件内容,直至遇到“ |
quit |
此命令表示要结束邮件发送过程,SMTP邮件接收程序接收到此命令后,将关闭与SMTP邮件发送程序的网络连接。 |
注:其它SMTP命令的语法及功能描述可以参考RFC821和RFC1869文档。
对于SMTP邮件发送程序发送的每一条命令,SMTP邮件接收程序都将回应一条响应信息。每条响应信息都以一个响应状态开头,如:250 OK
。响应状态用于表示SMTP服务器对请求命令的处理结果和状态,它是一个三位的十进制数。响应状态码的最高位数字代表了不同的分类,当其为 2 时表示命令执行成功;为5时表示命令执行失败;为3时表示命令没有完成。关于响应状态码所代表的具体含义,可以参考RFC821文档。
POP3协议
POP3协议在RFC 1939文档中定义,它采用的网络监听端口号默认为110。POP3协议共定义了 12 条POP3命令,邮件客户端程序通过这些命令来检索和获取用户电子邮箱中的邮件信息。下表列举出了这12条POP3命令及其说明,其中,
POP3命令格式 | 说明 |
---|---|
user |
user 命令是POP3客户端程序与POP3邮件服务器建立连接后通常发送的第一条命令,参数 username 表示收件人的帐户名称。 |
pass |
pass 命令是在user命令成功通过后,POP3客户端程序接着发送的命令,它用于传递帐户的密码,参数 password 表示帐户的密码。 |
apop |
apop 命令用于替代user和pass命令,它以MD5 数字摘要的形式向POP3邮件服务器提交帐户密码。 |
stat |
stat 命令用于查询邮箱中的统计信息,例如:邮箱中的邮件数量和邮件占用的字节大小等。 |
uidl |
uidl 命令用于查询某封邮件的唯一标志符,参数msg#表示邮件的序号,是一个从1开始编号的数字。 |
list |
list 命令用于列出邮箱中的邮件信息,参数 msg#是一个可选参数,表示邮件的序号。当不指定参数时,POP3服务器列出邮箱中所有的邮件信息;当指定参数msg#时,POP3服务器只返回序号对应的邮件信息。 |
retr |
retr 命令用于获取某封邮件的内容,参数 msg#表示邮件的序号。 |
dele |
dele 命令用于在某封邮件上设置删除标记,参数msg#表示邮件的序号。POP3服务器执行dele命令时,只是为邮件设置了删除标记,并没有真正把邮件删除掉,只有POP3客户端发出quit命令后,POP3服务器才会真正删除所有设置了删除标记的邮件。 |
rest |
rest 命令用于清除所有邮件的删除标记。 |
top |
top 命令用于获取某封邮件的邮件头和邮件体中的前n行内容,参数msg#表示邮件的序号,参数n表示要返回邮件的前几行内容。使用这条命令以提高 Web Mail系统(通过Web站点上收发邮件)中的邮件列表显示的处理效率,因为这种情况下不需要获取每封邮件的完整内容,而是仅仅需要获取每封邮件的邮件头信息。 |
noop |
noop 命令用于检测POP3客户端与POP3服务器的连接情况。 |
quit |
quit 命令表示要结束邮件接收过程,POP3服务器接收到此命令后,将删除所有设置了删除标记的邮件,并关闭与POP3客户端程序的网络连接。 |
对于POP3客户程序发送的每一条POP3命令,POP3服务器都将回应一些响应信息。响应信息由一行或多行文本信息组成,其中的第一行始终以“+OK” 或 “-ERR” 开头,它们分别表示当前命令执行成功或执行失败。
MIME标准
以往的邮件发送协议RFC822文档中定义,只能发送文本信息,无法发送非文本的邮件,针对这个问题,人们后来专门为此定义了MIME(Multipurpose Internet Mail Extension,多用途Internet邮件扩展)协议。
MIME协议用于定义复杂的邮件体格式,它可以表达多段平行的文本内容和非文本的邮件内容,例如,在邮件体中内嵌的图像数据和邮件附件等。另外,MIME协议的数据格式也可以避免邮件内容在传输过程发生信息丢失。
对于表示某个具体资源的MIME消息,它的消息头中需要指定资源的数据类型;对于MIME组合消息,它的消息中需要指定组合关系。具体资源的数据类型和组合消息的组合关系,都是通过消息头中的Content-Type头字段来指定的。
MIME消息由两部分组成,分别是消息头和消息体。其中,消息头中的语句Mime-Version: 1.0
作为判断Mime协议的标志。头部字段介绍:
Content-Type
描述数据的类型和编码,默认为“text/plain”,“/”前后分别为主要类型和次要类型。详细的类型可参考:http://www.iana.org/assignments/media-types/media-types.xhtml
text/plain
text/html
image/jpeg
audio/mpeg
video/3gpp
application/gzip
application/rtf
multipart/alternative
对每个Content-Type
,有不同的参数,如charset,name,boundary等
主类型“multipart”是MIME的精髓所在,它将多种数据编码在一起,常见的有“multipart/mixed“,” multipart/related“和”multipart/alternative”(详见注①)
当Content-Type
为“multipart/mixed”等时,表示数据为多种内容的混合,此时会有类似boundary="----=_NextPart_62299121_244BD0B8_04758B24"
的分隔线描述,分隔线会将数据内容分隔成各自独立的部分,在各部分中有独立的数据内容描述。分隔线的前后,会有“--”,处理过程中过滤即可。
Content-Disposition
描述数据的安排方式,如“attachment”表示为附件,“inline”表示为内嵌数据,常见参数有filename等
Content-Transfer-Encoding
描述内容的编码转换格式,一般有“base64”和“quoted-printable”两种,即表示内容为BASE64编码或QP编码
注①:multipart主类型用于表示MIME组合消息,它是MIME协议中最重要的一种类型。一封MIME邮件中的MIME消息可以有三种组合关系:混合、关联、选择,它们对应MIME类型如下:
- multipart/mixed
表示消息体中的内容是混和组合类型,内容可以是文本、声音和附件等不同邮件内容的混和体。比如一封邮件中即包含附件,邮件内容还引用内嵌的图片或附件资源,这种类型邮件的MIME类型就必须定义为multipart/mixed。
- multipart/related
表示消息体中的内容是关联(依赖)组合类型。比如:邮件内容有一个img标签,这个标签的src属性指向的是邮件内部的一个图片资源,所以这封邮件MIME类型就应该定义为multipart/related
- multipart/alternative
表示消息体中的内容是选择组合类型,例如一封邮件的邮件正文同时采用HTML格式和普通文本格式进行表达时,就可以将它们嵌套在一个multipart/alterntive类型的组合消息中。这种做法的好处在于如果邮件阅读程序不支持HTML格式时,可以采用其中的文本格式进行替代。
一封最复杂的电子邮件的基本情况为:含有邮件正文和邮件附件,邮件正文可以同时使用HTML格式和普通文本格式表示,并且HTML格式的正文中又引用了其它的内嵌资源。对于这种最复杂的电子邮件,可以采用下图所示的MIME消息结构进行描述:
从上图中可以看出,如果在邮件中要添加附件,就必须将整封邮件的MIME类型定义为multipart/mixed;如果要在HTML格式的正文中引用内嵌资源,那就要定义multipart/related类型的MIME消息;如果普通文本内容与HTML文本内容共存,那就要定义multipart/alternative类型的MIME消息。
注意:如果整封邮件中只有普通文本内容与HTML文本内容,那么整封邮件的MIME类型则应定义为multipart/alternative;如果整封邮件中包含有HTML文本内容和内嵌资源,但不包含附件,那么整封邮件的MIME类型则应该定义为multipart/related。
了解更多MIME协议的细节,请参考《张孝祥JAVA邮件开发详解》第三章 邮件的组织结构,第2小节 MIME协议
pop3接收邮件示例📎mail-pop3.txt