钓鱼邮件检测——获取邮件正文等使用LSTM肯定是可以解决的

EmailDetective: An Email Authorship Identification And Verification Model

今天,电子邮件经常被用于非法网络犯罪,因此验证电子邮件作者的身份非常重要。本文提出了一种解决匿名邮件作者归属问题的通用模型,该模型可用于邮件作者身份识别和邮件作者身份验证。第一种情况是在众多可疑目标中找出匿名邮件的作者。另一种情况是验证电子邮件是否由发件人撰写。本文从邮件头和邮件正文中提取特征,分析邮件作者的写作风格和其他行为。邮件作者的行为通过统计算法从邮件头中提取出来。此外,采用序列-序列双向长短期记忆(BiLSTM)算法提取了作者在邮件正文中的写作风格。该模型结合多种因素,解决了匿名邮件作者归属问题。实验结果表明,该模型的精度和其他指标均优于其他方法。在电子邮件作者验证实验中,我们的平均准确率、平均召回率和平均F1评分达到89.9%。在电子邮件作者鉴定实验中,我们模型的准确率分别为98.9%、92.9%和89.5%,10位作者的准确率为98.9%,25位作者的准确率为92.9%,50位作者的准确率为89.5%。

Providing Email Privacy by Preventing Webmail from Loading Malicious XSS Payloads

随着网络技术的发展,电子邮件已成为现代社会的一种正式的通信方式。邮件中往往包含大量的个人隐私信息、可能的商业协议和敏感附件,这使邮件成为黑客的攻击目标。黑客最常用的攻击手段之一是电子邮件XSS(跨站脚本),利用XSS漏洞,黑客可以窃取身份信息,登录受害者邮箱,直接窃取内容。因此,本文提出了一种基于深度学习技术的邮件XSS检测模型,该模型能够识别邮件中是否携带XSS载荷。首先,该模型可以提取原始邮件中的发件人、收件人、主题、内容、附件字段信息。其次,对数据进行处理后,形成电子邮件XSS语料库。引入Word2Vec算法,对每个邮件样本进行语料训练和特征提取。最后,该模型利用双向RNN算法和注意机制训练电子邮件XSS检测模型。实验中,双向RNN模型的AUC(曲线下面积)值达到0.9979。引入注意机制后,双向RNN模型的精度上限提高到0.9936,损失值降低到0.03。

 

Phishing Email Detection Using Improved RCNN Model With Multilevel Vectors and Attention Mechanism

钓鱼邮件是当今世界的重大威胁之一,已经造成了巨大的经济损失。虽然对抗方法不断更新,但目前这些方法的效果并不令人满意。此外,近年来,钓鱼电子邮件正以惊人的速度增长。因此,需要更有效的钓鱼检测技术来抑制钓鱼邮件的威胁。本文首先分析了电子邮件的结构。然后,基于改进的多级矢量卷积神经网络模型和注意机制,提出了一种新的钓鱼邮件检测模型THEMIS,该模型用于从邮件头、邮件正文、字符三个层次对邮件进行建模。和词级同时进行。为了评估THEMIS的有效性,我们使用一个不平衡的数据集,它具有钓鱼和合法电子邮件的真实比例。实验结果表明,THEMIS系统的总体准确率达到99.848%。同时,误报率(FPR)为0.043%。准确率高,FPR低,可以保证过滤器能够高概率识别钓鱼邮件,并尽可能少地过滤合法邮件。这一有希望的结果优于现有的检测方法,并验证了THEMIS在钓鱼邮件检测中的有效性。

基于LSTM与随机森林混合构架的钓鱼网站识别研究

摘要:针对传统的钓鱼站点攻击检测模型时延高、效率低、特征提取复杂的问题,提出一种使用长短期记忆网络(long short term memory,LSTM)和随机森林的混合算法模型。该模型主要包括网址上下文特征提取和混合特征分类两部分。首先,根据循环神经网络特点建立128步长的深度网络结构。实验数据参考开源社区提供的钓鱼网站网址和正常网址情报。利用自然语言处理技术对网址数据进行编码得到具有局部特征的网址序列。通过构建的LSTM网络对网址序列进行字符上下文特征提取,结合传统检测方法中的非字符序列特征,共同构成实验特征集。随后,利用随机森林获取每一个特征的最佳分裂点,构建混合特征分类模型。该模型以网址数据为检测源,一方面降低了随机森林的字符序列特征维度,另一方面结合传统钓鱼网址检测中的非序列特征,弥补了LSTM算法检测特征单一的问题。为验证该模型的有效性,设计了本文模型与随机森林算法、LSTM算法的对比实验,并进一步对不同LSTM训练规模的时间成本进行分析。从实验中发现,基于LSTM与随机森林的混合模型大幅度提高了钓鱼网站的识别准确率,模型准确率达到98.52%,比相同训练规模的LSTM准确率高3%,比实验中的单一随机森林准确率高7%。同时,相比于LSTM算法同等幅度的准确率提升,该混合算法具有更小的时间代价。实验结果表明,作者提出的混合模型克服了传统识别模型在特征提取、识别效率上的问题,适合于海量钓鱼网站攻击的快速识别。

Security Analysis and Threats Detection Techniques on Docker Container

Docker容器技术是一种新兴的虚拟化技术,在开发和部署阶段具有非常高的效率。虽然Docker容器技术比传统虚拟化技术-虚拟机更方便,但Docker镜像发布审计流程不成熟,安全性较差。因此,为了保护宿主机或本地Docker容器的安全,防止恶意Docker容器的攻击,需要检测Docker镜像中存在的潜在威胁,找出Docker容器实例在宿主机上运行的风险。本文详细分析了Docker现有的安全机制,以及Docker用户面临的主要威胁。最后,针对Docker镜像和容器实例给出了相应的威胁检测技术,实验结果证明了该检测框架的有效性。

 

posted @ 2020-11-11 09:55  bonelee  阅读(1478)  评论(0编辑  收藏  举报