Fork me on GitHub

09 2017 档案

摘要:一、概述 1.DPI(Deep packet inspection,深度报文解析) 所谓“深度”是和普通的报文分析层次相比较而言的,“普通报文检测”仅分析IP包4 层以下的内容,包括源地址、目的地址、源端口、目的端口以及协议类型,而DPI 除了对前面的层次分析外,还增加了应用层分析,识别各种应用及其 阅读全文
posted @ 2017-09-29 21:40 stardsd 阅读(9667) 评论(0) 推荐(0) 编辑
摘要:详解DPI与网络回溯分析技术 随着网络通讯技术进步与发展,网络通讯已跨入大数据时代,如何监控各类业务系统的通讯数据在大数据流量中传输质量,以及针对海量的网络通讯数据的范畴中存在少量的恶意流量的检测,避免恶意通讯对主机、网络设备的root权限的安全威胁,和通讯内容的窃取。是网络管理必须面对的一个难题。 阅读全文
posted @ 2017-09-29 21:29 stardsd 阅读(28545) 评论(0) 推荐(0) 编辑
摘要:一、层次聚类 1、层次聚类的原理及分类 1)层次法(Hierarchicalmethods)先计算样本之间的距离。每次将距离最近的点合并到同一个类。然后,再计算类与类之间的距离,将距离最近的类合并为一个大类。不停的合并,直到合成了一个类。其中类与类的距离的计算方法有:最短距离法,最长距离法,中间距离 阅读全文
posted @ 2017-09-17 19:07 stardsd 阅读(8897) 评论(0) 推荐(1) 编辑
摘要:一、相对危险度(RR)——队列研究中分析暴露因素与发病的关联程度 队列研究是选择暴露及未暴露于某一因素的两组人群,追踪其各自的发病结局,比较两组发病结局的差异,从而判定暴露因素与疾病有无关联及关联大小的一种观察性研究。通常,暴露可以指危险因素,比如吸烟、高血压,也可指服用某种药物。而事件可以是疾病发 阅读全文
posted @ 2017-09-16 18:57 stardsd 阅读(18363) 评论(0) 推荐(0) 编辑
摘要:ARCH模型的基本思想 ARCH模型的基本思想是指在以前信息集下,某一时刻一个噪声的发生是服从正态分布。该正态分布的均值为零,方差是一个随时间变化的量(即为条件异方差)。并且这个随时间变化的方差是过去有限项噪声值平方的线性组合(即为自回归)。这样就构成了自回归条件异方差模型。 由于需要使用到条件方差 阅读全文
posted @ 2017-09-14 20:33 stardsd 阅读(2165) 评论(0) 推荐(0) 编辑
摘要:在Apriori算法原理总结中,我们对Apriori算法的原理做了总结。作为一个挖掘频繁项集的算法,Apriori算法需要多次扫描数据,I/O是很大的瓶颈。为了解决这个问题,FP Tree算法(也称FP Growth算法)采用了一些技巧,无论多少数据,只需要扫描两次数据集,因此提高了算法运行的效率。 阅读全文
posted @ 2017-09-06 21:16 stardsd 阅读(761) 评论(0) 推荐(0) 编辑
摘要:在关联规则挖掘领域最经典的算法法是Apriori,其致命的缺点是需要多次扫描事务数据库。于是人们提出了各种裁剪(prune)数据集的方法以减少I/O开支,韩嘉炜老师的FP-Tree算法就是其中非常高效的一种。 名词约定 举个例子,设事务数据库为: A E F G A F G A B E F G E 阅读全文
posted @ 2017-09-06 21:05 stardsd 阅读(5013) 评论(0) 推荐(0) 编辑