2016年4月22日

FP树

摘要: Apriori算法需要产生大量候选项集,重复计算support_count 把事务集中关联信息及count记录在树上,扫描树即可 FP树主要分成两步 = FP树构建 + FP树挖掘 构造初始FP树 => 挖掘FP树获得条件模式基 => 构造条件FP树 => 挖掘条件FP树 => ... 如此递归直至 阅读全文

posted @ 2016-04-22 13:11 IvanSSSS 阅读(1301) 评论(0) 推荐(0) 编辑

weka中TF-IDF设置

摘要: 经典TF-IDF=tf*log(N/n) 在weka中StringToWordVector: IDFTransform=true, TFTransform=false, ouputWordCounts=True 才对 之前一直没设置ouputWordCounts... 坑比... 阅读全文

posted @ 2016-04-22 13:11 IvanSSSS 阅读(572) 评论(0) 推荐(0) 编辑

关联规则

摘要: 关联规则 项的集合T={I1,I2,...Im} 事务集D 每个事务t∈D, t由T中某些项组成。 关联规则:A=>B support(A=>B)=P(A∪B) confidence(A=>B)=P(B|A)=support(A∪B)/support(A)=count(A∪B)/count(A) f 阅读全文

posted @ 2016-04-22 13:10 IvanSSSS 阅读(366) 评论(0) 推荐(0) 编辑

自编码算法与稀疏性

摘要: 前一章神经网络是有监督学习的,自编码神经网络是无监督学习的,使用反向传播算法,让目标值=输入值。 1)隐藏层单元数少 迫使神经网络进行数据压缩,找到有趣的结构,与PCA相似 做法和普通神经网络一样,只是y=x 2)隐藏层单元数多 给隐藏层加入稀疏性限制 - 对sigmoid函数来说,输出接近1为激活 阅读全文

posted @ 2016-04-22 13:08 IvanSSSS 阅读(220) 评论(0) 推荐(0) 编辑

导航