神经元的变换函数
从净输入到输出的变换函数称为神经元的变换函数,即
- 阈值型变换函数
比如符号函数 - 非线性变换函数
比如单极性Sigmoid函数
又比如双极性S型(又曲正切)函数 - 分段性变换函数
比如 - 概率型变换函数
这时输入与输出之间的关系是不确定的,需要用一个随机函数来描述输出状态为1或为0的概率。设输出为1的概率为T为温度参数,这种神经元模型也称为热力学模型。
学习规则
改变权值的规则称为学习规则或学习算法。
学习规则 | 权值调整 |
权值初始化 |
学习方式 | 变换函数 | |
向量式 | 元素式 | ||||
Hebbian |
|
|
0附近的小随机数 | 无导师 | 任意 |
离散Percrptron |
|
|
任意 | 有导师 | 二进制 |
连续感知器δ规则 |
|
|
任意 | 有导师 | 连续 |
最小均方LMS(Widrow-Hoff规则) |
|
|
任意 | 有导师 | 任意 |
相关Correlation |
|
|
0 | 有导师 | 任意 |
胜者为王 Winner-take-all |
|
|
随机,归一化 | 无导师 | 连续 |
外星Outstar |
|
|
0 | 有导师 | 连续 |
Hebb学习规则指出:当神经元的突触前膜电位与突触后膜电位同时为正时,突触传导增强;电位相反时,突触传导减弱。应预先设置权值饱和值,防止输入和输出正负始终一致时出现权值无约束增长。
η是学习率。
在离散感知器学习规则中,期望输出dj和实际输出sgn(WjTX)取值都是-1和1。这种感知器仅适合于二进制神经元。
连续感知器δ规则要求变换函数是可导的,因此只能用于有导师学习中定义的连续变换函数,如Sigmoid函数。实际上δ规则是由输出与期望的最小平方误差推导出来的。
最小均方学习规则实际上是δ规则的特例--在δ规则中令。最小均方学习规则与变换函数无关,不需要对变换函数求导,不仅学习速度快,而且具有较高的精度。它能使实际输出与期望输出之间的平均方差最小(什么意思?why?)。
胜者为王规则中有一个竞争层,对于特定的输入,竞争层的每个神经元均有输出响应,其中响应最大的神经元j*成为获胜神经元,只有获胜神经元才有权调整其权值向量。学习率应该随着学习的进展而减小。
外星学习规则使权向量向期望输出靠拢。
单层感知器
单层感知器只有输入层和输出层,它仅对线性可分问题具有分类能力,在实际中很少使用。
多层感知器
隐藏层的加入使感知器能够解决非线性的分类问题,并且双隐藏层感知器足以解决任何复杂的分类问题。
当变换函数从线性函数变为非线性函数时,分类边界的基本元素从直线变为曲线,这样整个分类边界线变成连续光滑的曲线,从而提高感知器的分类能力。
对于各隐藏层节点来说,不存在期望输出,因而学习规则对隐藏层权值不适用。
自适应线性单元(Adaptive Linear Neuron)
使用最小均方学习规则LMS(Least Mean Square),即最小二乘法。
本文来自博客园,作者:高性能golang,转载请注明原文链接:https://www.cnblogs.com/zhangchaoyang/articles/2588728.html
【推荐】国内首个AI IDE,深度理解中文开发场景,立即下载体验Trae
【推荐】编程新体验,更懂你的AI,立即体验豆包MarsCode编程助手
【推荐】抖音旗下AI助手豆包,你的智能百科全书,全免费不限次数
【推荐】轻量又高性能的 SSH 工具 IShell:AI 加持,快人一步
· 从 HTTP 原因短语缺失研究 HTTP/2 和 HTTP/3 的设计差异
· AI与.NET技术实操系列:向量存储与相似性搜索在 .NET 中的实现
· 基于Microsoft.Extensions.AI核心库实现RAG应用
· Linux系列:如何用heaptrack跟踪.NET程序的非托管内存泄露
· 开发者必知的日志记录最佳实践
· TypeScript + Deepseek 打造卜卦网站:技术与玄学的结合
· Manus的开源复刻OpenManus初探
· 写一个简单的SQL生成工具
· AI 智能体引爆开源社区「GitHub 热点速览」
· C#/.NET/.NET Core技术前沿周刊 | 第 29 期(2025年3.1-3.9)