Tensorflow七种初始化函数

一、tf.constant_initializer(value)

作用:将变量初始化为给定的常量,初始化一切所提供的值。

二、tf.zeros_initializer()

作用:将变量设置为全0;也可以简写为tf.Zeros()

三、tf.ones_initializer()

作用:将变量设置为全1;可简写为tf.Ones()

四、tf.random_normal_initializer(mean,stddev)

作用:将变量初始化为满足正太分布的随机值,主要参数(正太分布的均值和标准差),用所给的均值和标准差初始化均匀分布。

五、tf.truncated_normal_initializer(mean,stddev,seed,dtype)

作用:将变量初始化为满足正太分布的随机值,但如果随机出来的值偏离平均值超过2个标准差,那么这个数将会被重新随机。
  1. mean:用于指定均值;
  2. stddev用于指定标准差;
  3. seed:用于指定随机数种子;
  4. dtype:用于指定随机数的数据类型。通常只需要设定一个标准差stddev这一个参数就可以。

举例:bert中初始化token_type_embeddings、embedding_table时,假设token_type_embeddings服从正态分布

六、tf.random_uniform_initializer(a,b,seed,dtype)

作用:从a到b均匀初始化,将变量初始化为满足均匀分布的随机值,主要参数(最大值,最小值)。

七、tf.uniform_unit_scaling_initializer(factor,seed,dtypr)

作用:将变量初始化为满足均匀分布但不影响输出数量级的随机值

 

参考文献:
posted @   nxf_rabbit75  阅读(1553)  评论(0编辑  收藏  举报
编辑推荐:
· go语言实现终端里的倒计时
· 如何编写易于单元测试的代码
· 10年+ .NET Coder 心语,封装的思维:从隐藏、稳定开始理解其本质意义
· .NET Core 中如何实现缓存的预热?
· 从 HTTP 原因短语缺失研究 HTTP/2 和 HTTP/3 的设计差异
阅读排行:
· 分享一个免费、快速、无限量使用的满血 DeepSeek R1 模型,支持深度思考和联网搜索!
· 使用C#创建一个MCP客户端
· ollama系列1:轻松3步本地部署deepseek,普通电脑可用
· 基于 Docker 搭建 FRP 内网穿透开源项目(很简单哒)
· 按钮权限的设计及实现
历史上的今天:
2018-12-24 Python中获取字典中最值对应的键
一、tf.constant_initializer(value)二、tf.zeros_initializer()三、tf.ones_initializer()四、tf.random_normal_initializer(mean,stddev)五、tf.truncated_normal_initializer(mean,stddev,seed,dtype)六、tf.random_uniform_initializer(a,b,seed,dtype)七、tf.uniform_unit_scaling_initializer(factor,seed,dtypr) 
点击右上角即可分享
微信分享提示