摘要:
如图,两个矩形重叠部分的边框都显示了,是拆分操作,不是组合。 阅读全文
摘要:
在src下的包含Main的包下打开命令行,javac -classpath “路径到src,不到包下” Main.java 阅读全文
摘要:
如果需要代做算法,可以联系我...博客右侧有联系方式。 一、相关概念 1.梯度下降 由于Z= X*theta - y是列向量,所以Z'*Z就是平方和连加,就是2范数;如果Z是矩阵呢,那么Z'*Z的对角线就是Z矩阵每列的2范数。 2.正规方程(Normal Equation) θ = (XTX)-1X 阅读全文
摘要:
如果需要代做算法,可以联系我...博客右侧有联系方式。 一、正规化方程概念 假设我们有m个样本。特征向量的维度为n。因此,可知样本为{(x(1),y(1)), (x(2),y(2)),... ..., (x(m),y(m))},其中对于每一个样本中的x(i),都有x(i)={x1(i), xn(i) 阅读全文
摘要:
简单来说,它主要用来把所有特征值范围映射至同样的范围里面如(0,1)、(-1,1)、(-0.5,0.5)等。 Feature scaling (数据规范化) 是数据挖掘或机器学习常用到的步骤,这个步骤有时对算法的效率和准确率都会产生巨大的影响。 对精度的影响:很明显,这个步骤的必要性要依赖于... 阅读全文
摘要:
一、第一种理解 相对熵(relative entropy)又称为KL散度(Kullback–Leibler divergence,简称KLD),信息散度(information divergence),信息增益(information gain)。 KL散度是两个概率分布P和Q差别的非对称性... 阅读全文
摘要:
一个演讲者演讲能力的高低,除了要看演讲者的演讲内容能否吸引听众,是否具有自信、幽默、机智等特点外,还要看演讲者在演讲的结尾表现的是否精彩。结尾也是演讲的重要组成部分,精彩的结束语,能够促人深思,耐人寻味,给听众留下难以忘怀的印象。 在演讲的结尾要努力调动一切积极因素,把听众的情绪推倒最高的浪峰... 阅读全文
摘要:
贝叶斯网络定了这样一个独立的结构:一个节点的概率仅依赖于它的父节点。贝叶斯网络更加适用于稀疏模型,即大部分节点之间不存在任何直接的依赖关系。联合概率,即所有节点的概率,将所有条件概率相乘:我们最终的目标是计算准确的边缘概率,比如计算Hangover的概率。在数学上,边缘概率被定义为各种状态下系统所有... 阅读全文
摘要:
归一化是一种简化计算的方式,即将有量纲的表达式,经过变换,化为无量纲的表达式,成为纯量。归一化是为了加快训练网络的收敛性,可以不进行归一化处理 归一化的具体作用是归纳统一样本的统计分布性。归一化在0-1之间是统计的概率分布,归一化在-1--+1之间是统计的坐标分布。 在这里主要讨论两种归一化... 阅读全文
摘要:
一、矩阵存储方式 MATLAB的矩阵有两种存储方式,完全存储方式和稀疏存储方式 1.完全存储方式 将矩阵的全部元素按列存储,矩阵中的全部零元素也存储到矩阵中。 2.稀疏存储方式 仅存储矩阵所有的非零元素的值及其位置,即行号和列号,显然这对于具有大量零元素的稀疏矩阵来说是十分有效的。 设 ... 阅读全文