一、配置采集用户

1、添加和修改文件的功能  :account . json

2、存储目录:D:/mail/account/

重点知识:创建json文件,Jason文件保存字符串格式

举例:

// json文件写入字符串
String json = "{\"account\":{\"username\":\"" + args[0] + "\",\"password\":\"" + args[1] + "\"}}";
// 写入字符串
FileWriter fw = new FileWriter(fa);

二、采集邮件

1、读取和解析account . json

a、得到登录用户和密码

2、登录邮箱系统

3、获取和解析收件箱

a、获得未采集的邮件信息列表

b、获取已采集的邮箱列表

4、获取和解析邮件内容

a、如果包含附件,解析和下载附件

三、存储邮件

 

1、邮件命名:发送时间的时间戳
a、解决时间戳重复问题

2、存储目录 :D:/mail/data/

3、存储附件

a、单独存储

b、在邮件内容中记录附件信息

1)文件名

2)储存路径

3)MD5值:鉴别真伪

4、存储已抓取的邮件信息

a、为了鉴别未采集的邮件

b、存储已抓取的邮件信息

1)去重

2)添加带附件邮件的标记

3)存储检索方便,存储邮件的多个信息

 

四、邮件查看

1、-account

a、显示当前采集的用户信息,包含用户性、密码。

2、-status

a、统计邮件信息,同价项目有:共有多少封邮件,包含附件的邮件有多少封记

3、-search<keyword>

a、从邮件中搜索出包含keyword的邮件,结果中包含搜躲到别的邮件个数,存储位置与标题。

 

posted on 2016-08-23 12:57  周帝  阅读(412)  评论(1编辑  收藏  举报