摘要: 关联规则,营销购物 空缺 协同过滤 阅读全文
posted @ 2018-12-06 21:03 当归远志 阅读(157) 评论(0) 推荐(0) 编辑
摘要: 聚类 Clustering 根据评论信息做一些聚类,挖掘关系。 bug 期望最大法 peek高峰的个数与高斯函数的个数不一定相同 Z隐含参数 不需要求 每个点属于哪个簇 类似于辅助线 跳板 借力 模型参数是要求的 theta是两个聚类的中心点 密度与层次 剔除噪点 从底往上 阅读全文
posted @ 2018-12-06 19:54 当归远志 阅读(209) 评论(0) 推荐(0) 编辑
摘要: SVM B分割得更加无偏 比较公平 卡着分界面的点叫支持向量,就好比托着分界面 支持向量决定了可移动的范围,这个范围就叫margin 分界面可移动的距离 前提是先要被分对 对偶问题一般是不等价的,但是在SVM这里,在满足一些条件的前提下,是等价的。对偶之后,只有alpha,没有w和b 很多alpha 阅读全文
posted @ 2018-12-06 16:57 当归远志 阅读(198) 评论(0) 推荐(0) 编辑
摘要: Networks 多层感知机 不是说这个神经网络要与人的大脑神经完全相似,也不是说要多么的强大,而是在一定程度上模拟了人脑神经元的能力,就足够了 为什么要w0呢,因为没有w0超平面一定会经过原点,所以w0和x0是很重要的。 一个样本相当于知错就改 理解公式背后的含义,学习率控制每次修改的幅度,很多公 阅读全文
posted @ 2018-12-06 15:08 当归远志 阅读(229) 评论(0) 推荐(0) 编辑
摘要: ID3 ID3算法倾向于分的很细的变量 C4.5加入分母为惩罚量 阅读全文
posted @ 2018-12-05 17:29 当归远志 阅读(110) 评论(0) 推荐(0) 编辑
摘要: 贝叶斯 决策树 知道三文鱼和金枪鱼颜色 让你去猜 B命中的概率不能直接减去四分之三 因为有可能同时命中 A B 命中不是互斥事件 即便体检报告是阳性,真正得癌症的概率也很小,只有0.21 绝大多数的阳性都是假阳性 False Positive H头疼 F得了流感了 加了一个限定范围之后,居然就独立了 阅读全文
posted @ 2018-12-04 17:39 当归远志 阅读(174) 评论(0) 推荐(0) 编辑
摘要: 特征选择 男女身高 男女抽烟 先验分布 熵 衡量系统的不确定性 属性的价值 降低了不确定性 降低的幅度越高越好 主成分分析 旋转是的数据间的correlation消失掉 Q是正交阵 七长八短,长宽相关性不好,信息丢失了很多。 线性判别分析 两种颜色投影重叠,分类问题就很尴尬,没法处理 PCA不考虑L 阅读全文
posted @ 2018-12-04 16:31 当归远志 阅读(173) 评论(0) 推荐(0) 编辑
摘要: 数据预处理 https://www.bilibili.com/video/av23933161/?p=11 http://www.xuetangx.com/courses/course v1:TsinghuaX+80240372X+2018_T1/about Outline 最后2个:特征选择 PC 阅读全文
posted @ 2018-12-03 22:34 当归远志 阅读(166) 评论(0) 推荐(0) 编辑
摘要: Learning Resources 书籍: 期刊: 业界先驱: 开阔视野,掌握业界最新动态。 工具: 数据挖掘是很多学科的综合体: 甭管叫什么名字,归根到底都是数据挖掘: Comprehensive Learning: Learning != Listening 数据 What is Big Da 阅读全文
posted @ 2018-12-03 19:16 当归远志 阅读(255) 评论(0) 推荐(0) 编辑
摘要: ![](https://img2018.cnblogs.com/blog/1103990/201811/1103990-20181116211839515-434956939.png) ![](https://img2018.cnblogs.com/blog/1103990/201811/1103990-20181116211536344-1190608234.png) ![](htt... 阅读全文
posted @ 2018-11-16 21:16 当归远志 阅读(633) 评论(0) 推荐(0) 编辑