园龄：3年4个月粉丝：5 关注：3

12 2019 档案

元学习基本概念笔记

摘要：元学习是深度学习领域最活跃的研究领域之一。人工智能（AI）社区中的一些思想流派赞成这样的论点，即元学习是解锁人工智能（AGI）的垫脚石之一。近年来，我们已经看到了元学习技术的研究与开发中的爆炸式增长。但是，元学习背后的一些基本思想仍然被数据科学家和工程师误解。...

106

0

0

深度强化学习系列tensorflow2.0自定义loss函数实现policy gradient策略梯度

摘要：本篇文章利用tensorflow2.0自定义loss函数实现policy gradient策略梯度，自定义loss=-log(prob) *Vt现在训练最高分能到193分，但是还是不稳定，在修改中，欢迎一起探讨文章代码也有参考莫烦大佬的代码action_dim...

167

0

0

随笔：46
文章：14
评论：0
阅读：21003

公告

昵称：勒勒乐了
园龄： 3年4个月
粉丝： 5
关注： 3

<

2025年3月

>

日

一

二

三

四

五

六

23

24

25

26

27

28

1

2

3

4

5

6

7

8

9

10

11

12

13

14

15

16

17

18

19

20

21

22

23

24

25

26

27

28

29

30

31

1

2

3

4

5

随笔分类

随笔档案

文章分类

阅读排行榜

推荐排行榜

1. MarkDown常用公式符号(1)