03 2014 档案

摘要:学习了一下决策树算法(ID3)。 基本的理论知识: 信息熵:信息理论的鼻祖之一Claude E. Shannon(香农)把信息(熵)定义为离散随机事件的出现概率。一般而言,当一种信息出现概率更高的时候,表明它被传播得更广泛,或者说,被引用的程度更高。我们可以认为,从信息传播的角度来看,信息熵可以表示信息的价值。这样子我们就有一个衡量信息价值高低的标准,可以做出关于知识流通问题的更多推论。 计算公式... 阅读全文
posted @ 2014-03-04 20:20 独立寒风 阅读(366) 评论(0) 推荐(0) 编辑
摘要:adaboost算法是boosting算法的一种。boosting算法主要思想是用大量的简单的预测方法,得到一个比较准确的预测方法。譬如人脸检测中就是用的这种方法。adaboost伪代码:输入: 训练集:其中 训练的轮数T。For:初始化 //设置每组训练集的权重。开始都为1/m.For:1.对于弱分类器H,找到误判率最小的分类器 是误判率。其中 .2.如果,这里 是一个预先选择的阀值,停止训练。令3.For: 更新其中分母是标准化因子,保证是一个概率分布输出最终的分类器这个算法可以用到很多地方,不过需要选择大量的分类器。由于本人技术不是很好,欢迎来辩 阅读全文
posted @ 2014-03-02 23:26 独立寒风 阅读(890) 评论(0) 推荐(0) 编辑
摘要:1.suricata 是一个高性能的IDS(入侵检测系统),IPS,网络安全监控引擎。该项目是一个不受益的开源项目。2.suricata 运行模式从上图我们可以看出suricata核心有3个模块1.解码线程:解码线程包括。数据包的分片重组。UDP TCP 等等头部解析2.detect线程:TCP会话重组。木马检测,协议解析,文件存储,数据包存储等等模块。其实还有一个模块做的是会话管理工作。这个只是suricata的大致分析。下面会对一些比较重要的模块进行讲解 阅读全文
posted @ 2014-03-01 21:31 独立寒风 阅读(1505) 评论(0) 推荐(0) 编辑