随笔分类 - 神经网络原理课程
摘要:参考链接:https://www.yanxishe.com/TextTranslation/2668?from=wcm
阅读全文
摘要:1.信息熵及梯度计算 热力学中的熵:是表示分子状态混乱程度的物理量 信息论中的熵:用来描述信源的不确定性的大小 经常使用的熵概念有下列几种: 信息熵、交叉熵、相对熵、条件熵、互信息 信息熵(entropy) 信源信息的不确定性函数f通常满足两个条件: 是概率p的单调递减函数。 两个独立符号所产生的不
阅读全文
摘要:训练集和测试集(训练集包含两个文件:train_negative.txt和train_positive.text,分别包含2000多的负样本和2000多的正样本。文件里面的每一行代表一个样本(例如:一篇电影评论)。测试样本类似。): 链接:https://pan.baidu.com/s/1GybqI
阅读全文
摘要:1 """ 2 #演示内容:二次回归和线性回归的拟合效果的对比 3 """ 4 print(__doc__) 5 6 import numpy as np 7 import matplotlib.pyplot as plt 8 from sklearn.linear_model import Lin
阅读全文
摘要:1.线性回归模型及求解方法 什么是回归? X的行表示每个样本,列表示每个特征。 研究X和Y之间关系的统计分析方法称之为回归。其中X是自变量,Y是因变量。 利用训练数据,使用回归模型(如线性模型)去拟合变量之间的关系。因此训练任务就是利用数据,来学习模型中的参数 parameter(如线性模型中的斜率
阅读全文
摘要:1 """ 2 演示内容:文档的向量化 3 """ 4 from sklearn.feature_extraction.text import CountVectorizer 5 corpus = [ 6 'Jobs was the chairman of Apple Inc., and he wa
阅读全文
摘要:1.特征工程 什么是特征工程? 引自知乎:“数据和特征决定了机器学习的上限,而模型和算法只是逼近这个上限而已。 深度学习也要用到特征,需要对输入的特征进行组合变换等处理。 自动分词 自动分词就是将用自然语言书写的文章、句段经计算处理后,以词为单位给以输出,为后续加工处理提供先决条件。 词形规范化的两
阅读全文
摘要:1 #利用鸢尾花数据集绘制P-R曲线 2 print(__doc__) #打印注释 3 4 import matplotlib.pyplot as plt 5 import numpy as np 6 from sklearn import svm, datasets 7 from sklearn.
阅读全文
摘要:1.深度学习的引入 组合低层特征,形成了更加抽象的高层特征。 表达式中的u,w参数需要在训练中通过反向传播多次迭代调整,使得整体的分类误差最小。 深度学习网络往往包含多个中间层(隐藏层),且网络结构要更复杂一些。 2.数据集及其拆分 Iris(鸢尾花)数据集 分类特征:花萼和花瓣的宽度和长度 数据集
阅读全文