会员
周边
众包
新闻
博问
闪存
赞助商
Chat2DB
所有博客
当前博客
我的博客
我的园子
账号设置
会员中心
简洁模式
...
退出登录
注册
登录
躺柒
博客园
首页
新随笔
联系
订阅
管理
随笔 - 788
文章 - 0
评论 - 17
阅读 -
49126
读人工智能全传10深度思维
读人工智能全传10深度思维
合集 - 读人工智能全传(16)
1.
读人工智能全传
01图灵的电子大脑
2024-07-03
2.
读人工智能全传
02图灵测试
2024-07-04
3.
读人工智能全传
03分治策略
2024-07-05
4.
读人工智能全传
04NP完全问题
2024-07-06
5.
读人工智能全传
05专家系统
2024-07-07
6.
读人工智能全传
06逻辑编程
2024-07-08
7.
读人工智能全传
07智能体
2024-07-09
8.
读人工智能全传
08人工智能的今天
2024-07-10
9.
读人工智能全传
09神经网络
2024-07-11
10.
读人工智能全传
10深度思维
2024-07-12
11.
读人工智能全传
11人工智能会出什么错
2024-07-13
12.
读人工智能全传
12人工智能导致的问题1
2024-07-14
13.
读人工智能全传
13人工智能导致的问题2
2024-07-15
14.
读人工智能全传
14有意识的机器之路
2024-07-16
15.
读人工智能全传
15意向立场
2024-07-17
16.
读人工智能全传
16读后总结与感想兼导读
2024-07-25
1. 深度思维
1.1. DeepMind
1.1.1. 深度思维
1.1.2. 2014年的员工不足25人
1.1.3. 深度思维公司公开宣称其任务是解决智能问题
1.1.4. 2014年谷歌收购DeepMind,人工智能突然成了新闻热点,以及商业热点
1.1.4.1. 收购报价高达4亿英镑
1.1.4.2. 深度思维是人工智能领域最引人注目的收购
1.2. 科技公司都争先恐后投入这个领域,生怕被历史车轮甩落
1.2.1. 2015年,优步公司从卡内基-梅隆大学机器学习实验室揽获了至少40名研究人员
1.3. 雅达利游戏系统
1.3.1. 基于早期的雅达利2600系列游戏机
1.3.2. 1980年前后的产品
1.3.3. 最早获得成功的视频电子游戏平台之一
1.3.4. 它支持210×160像素网格的大分辨率视频,支持128位颜色
1.3.5. 用户通过一个带单独按钮的操作杆进行操作,游戏机使用插卡式游戏卡带
1.3.6. 深度思维用的游戏卡带一共有49个游戏
1.4. 深度思维的程序根本没有任何关于游戏的知识,程序得到的唯一信息是出现在游戏机屏幕上的图像(以210×160彩色像素网格的形式)和游戏的当前分数
1.4.1. 程序没有得到诸如“对象A在位置(x, y)上”之类的信息
1.4.2. 任何类似的信息都需要程序从原始的视频数据中自己提取
1.4.3. 程序通过强化学习自学玩游戏:反复玩同一个游戏,在每个游戏中进行实验并获得反馈,并学习哪些行为会得到奖励,而哪些不会
1.4.4. 雅达利游戏程序学会了游戏卡带中的29个游戏,表现出高于人类玩家平均水准的能力
1.4.4.1. 在某些游戏里面,它甚至达到了超人的水准
1.5. 他们所做的是写一个程序,让它学习如何比人类更会玩全部49个雅达利游戏中的29个
1.5.1. 程序接收到的唯一输入就是屏上显示的东西,以及分数
1.6. 玩打砖块游戏
1.6.1. 程序了解到,最有效率得高分的方式是在砖墙的一侧“钻”一个洞,让球打进去,这样球就会在砖墙和顶部屏障之间快速反弹,迅速消灭砖块,而玩家可以不用额外操作什么
1.6.1.1. 它是由程序自主学习的
1.7. 蒙特祖玛的复仇
1.7.1. 程序玩得特别糟糕的游戏
1.7.2. 它的难点在于奖励非常稀少
1.7.3. 玩家在获得奖励之前必须执行一系列复杂的任务
1.7.3.1. 这一点与打砖块这种游戏不同,在打砖块游戏中奖励反馈或多或少都是即时的
1.7.3.2. 如果奖励反馈在相关行动执行后很长时间才出现,就会给强化学习带来困难
1.7.3.2.1. 你可能不清楚是哪些行为导致了奖励的发生
1.8. 如果雅达利游戏程序是深度思维团队唯一完成的东西,那也足够让他们在人工智能的历史上留下令人尊重、浓墨重彩的一笔,但是,该团队随后又取得了一系列惊人的成就
1.8.1. 深度思维的工作,从他们的雅达利游戏机到AlphaZero,代表了人工智能领域一系列非凡的突破性成就
2. AlphaGo
2.1. 可能仍然是迄今为止最著名的人工智能系统
2.2. 使用了两个神经网络
2.2.1. 价值网络只负责评估给定的棋盘位置的优劣程度
2.2.2. 策略网络则根据当前棋盘的状况评估下一步棋该放在何处
2.3. 策略网络包含13层,首先使用监督式学习进行训练,训练的数据则是人类的专业棋手下棋的棋谱
2.4. 然后进行自我对战的强化学习
2.5. 最后,这两个网络被嵌入一个复杂的蒙特卡罗树这一搜索技术中
2.6. 撇开表象深入挖掘,你会发现AlphaGo中最能体现智慧的工程都源自经典的人工智能搜索
2.6.1. 于20世纪50年代开发了跳棋学习程序的亚瑟·塞缪尔,他在理解AlphaGo使用的搜索技术时不会有任何困难
2.6.2. 从他的跳棋程序,到现代最引人注目的人工智能系统,都遵循着同一条发展路径
2.7. AlphaGo尽管在围棋方面表现优秀,但它只能下围棋,还必须事先学习许多人类专业棋手的棋谱
3. AlphaGo Zero
3.1. 它的非凡之处在于它是从零开始学习下围棋的,没有学习任何人类棋手的棋谱
3.2. 在没有人工数据干预的情况下,它达到了超越人类棋手的水平,而这一切,只是通过它自己和自己下围棋来实现的
3.3. 在结束9个小时的自我学习以后,AlphaZero能够在和鳕鱼系统对战中连续击败对方,最少也能保持平局
3.3.1. 鳕鱼系统是世界领先的国际象棋程序之一
3.4. AlphaZero似乎可以自学成才,并且适用于多种不同类型的棋类游戏
3.5. 结论
3.5.1. 尽管AlphaZero体现了令人印象深刻的通用性(它在棋类游戏专业的通用性方面超过了此前任何一个人工智能系统),但它本身并不代表迈向通用人工智能的重大进步
3.5.2. 棋类游戏是相当抽象的,它们与现实世界相去甚远
4. 图像标注
4.1. 你对这幅图的理解是基于你在这个世界上作为一个人类存在的经历
4.2. 这样的理解对于标注机器人而言是不可能实现的,因为它没有这个基础
5. 自动翻译
5.1. 将一种语言自动翻译成另一种语言,是过去十年中因为深度学习技术而快速进步的另一个领域
5.2. 自动翻译工具能做到什么,又不能做到什么,有助于我们理解深度学习的局限性
5.3. 谷歌翻译可能算是最著名的自动翻译系统了
5.4. 关键就在于,你仅仅是懂得法语并不代表就能做好普鲁斯特小说的翻译
5.4.1. 关于20世纪初期法国社会和法国人生活的知识
5.4.1.1. 你得知道他们使用蜡烛照明
5.4.2. 法国历史的知识
5.4.2.1. 你得知道弗朗索瓦一世和查理五世之间的斗争史
5.4.3. 20世纪早期法国文学常识
5.4.3.1. 当时的写作风格,还有作者可能引用的典故
5.4.4. 对普鲁斯特本人的了解
5.4.4.1. 他最想表达的是什么
5.4.5. 需要你有大量的背景知识,谷歌翻译所使用的神经网络里可没有这些知识
5.5. 我们必须消除明确表示知识的世界和深度学习以及神经网络的世界之间的隔阂
6. 学界
6.1. 机器学习领域的两件学界大事是神经信息处理系统(NeurIPS)会议和国际机器学习会议(ICML)
6.2. 机器学习研究领域的许多人根本就不把自己视为“人工智能”的一部分
6.3. 不管分裂的起源是什么,事实就是,在某种程度上,机器学习研究领域的许多人脱离了主流人工智能,沿着自己的轨迹发展
合集:
读人工智能全传
好文要顶
关注我
收藏该文
微信分享
躺柒
粉丝 -
50
关注 -
0
+加关注
0
0
升级成为会员
«
上一篇:
读人工智能全传09神经网络
»
下一篇:
读人工智能全传11人工智能会出什么错
posted @
2024-07-12 06:45
躺柒
阅读(
40
) 评论(
0
)
编辑
收藏
举报
刷新页面
返回顶部
登录后才能查看或发表评论,立即
登录
或者
逛逛
博客园首页
【推荐】还在用 ECharts 开发大屏?试试这款永久免费的开源 BI 工具!
【推荐】编程新体验,更懂你的AI,立即体验豆包MarsCode编程助手
【推荐】凌霞软件回馈社区,博客园 & 1Panel & Halo 联合会员上线
【推荐】抖音旗下AI助手豆包,你的智能百科全书,全免费不限次数
【推荐】博客园社区专享云产品让利特惠,阿里云新客6.5折上折
【推荐】轻量又高性能的 SSH 工具 IShell:AI 加持,快人一步
相关博文:
·
读天才与算法:人脑与AI的数学思维笔记03_AlphaGo
·
读AI3.0笔记07_游戏与推理
·
TensorFlow 智能移动项目:6~10
·
AlphaGo——探索人工智能
·
《人工智能》李开复版读书笔记
阅读排行:
·
【.NET】调用本地 Deepseek 模型
·
CSnakes vs Python.NET:高效嵌入与灵活互通的跨语言方案对比
·
DeepSeek “源神”启动!「GitHub 热点速览」
·
Plotly.NET 一个为 .NET 打造的强大开源交互式图表库
·
我与微信审核的“相爱相杀”看个人小程序副业
历史上的今天:
2023-07-12
选读SQL经典实例笔记05_日期运算(下)
公告
昵称:
躺柒
园龄:
2年1个月
粉丝:
50
关注:
0
+加关注
<
2025年2月
>
日
一
二
三
四
五
六
26
27
28
29
30
31
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
1
2
3
4
5
6
7
8
搜索
常用链接
我的随笔
我的评论
我的参与
最新评论
我的标签
合集
学信息系统项目管理师第4版(35)
学系统集成项目管理工程师(中项)(43)
读高性能MySQL(第4版)(21)
读发布!设计与部署稳定的分布式系统(第2版)(34)
随笔及总结(26)
读改变未来的九大算法(10)
读数据压缩入门(11)
读C#代码整洁之道(8)
读编程与类型系统(12)
读函数式编程思维(6)
读Java8函数式编程(9)
读Java实战(第二版)(20)
读Java性能权威指南(第2版)(31)
读SQL进阶教程(17)
选读SQL经典实例(23)
读SQL学习指南(第3版)(13)
读图数据库实战(11)
读程序员的制胜技(15)
读像火箭科学家一样思考(16)
读程序员的README(19)
读算法霸权(13)
读元宇宙改变一切(14)
读AI3.0(10)
读千脑智能(13)
读十堂极简人工智能课(9)
读人工不智能:计算机如何误解世界(10)
读算法的陷阱:超级平台、算法垄断与场景欺骗(20)
读所罗门的密码(21)
读天才与算法:人脑与AI的数学思维(26)
读人工智能时代与人类未来(19)
读AI未来进行式(12)
读AI新生:破解人机共存密码(18)
读人工智能全传(16)
读写给大家的AI极简史(7)
读零信任网络:在不可信网络中构建安全系统(21)
读软件开发安全之道:概念、设计与实施(17)
读软件设计的要素(7)
读构建可扩展分布式系统:方法与实践(16)
读数据湖仓(9)
读数据工程之道:设计和构建健壮的数据系统(34)
读数据质量管理:数据可靠性与数据质量问题解决之道(20)
读数据保护:工作负载的可恢复性(31)
读量子霸权(18)
读算法简史:从美索不达米亚到人工智能时代(15)
读当我点击时,算法在想什么?(7)
读DAMA数据管理知识体系指南(4)
更多
随笔档案
2025年2月(25)
2025年1月(31)
2024年12月(31)
2024年11月(30)
2024年10月(31)
2024年9月(30)
2024年8月(31)
2024年7月(31)
2024年6月(30)
2024年5月(31)
2024年4月(30)
2024年3月(31)
2024年2月(29)
2024年1月(31)
2023年12月(31)
2023年11月(30)
2023年10月(31)
2023年9月(30)
2023年8月(31)
2023年7月(31)
2023年6月(30)
2023年5月(31)
2023年4月(31)
2023年3月(36)
2023年2月(28)
2023年1月(26)
阅读排行榜
1. C#代码整洁之道读后总结与感想(599)
2. 选读SQL经典实例笔记01_检索和排序(369)
3. 读C#代码整洁之道笔记01_C#的编码标准和原则(311)
4. 读C#代码整洁之道笔记04_重构C#代码识别代码坏味道(309)
5. 学信息系统项目管理师第4版系列02_法律法规(268)
评论排行榜
1. 2023年1月随笔(11)
2. 2023年10月随笔之婚宴趣事多(2)
3. 读高性能MySQL(第4版)笔记12_查询性能优化(下)(2)
4. 读Java性能权威指南(第2版)笔记18_垃圾回收E(2)
推荐排行榜
1. 读高性能MySQL(第4版)笔记01_MySQL架构(上)(2)
2. 选读SQL经典实例笔记01_检索和排序(2)
3. 读软件设计的要素01概念(1)
4. 读AI未来进行式笔记01深度学习(1)
5. 读所罗门的密码笔记01_当人类遇见机器(1)
最新评论
1. Re:2023年10月随笔之婚宴趣事多
@gz4621 wondershare mindmaster...
--躺柒
2. Re:2023年10月随笔之婚宴趣事多
大神 思维导图用的什么软件制作的?
--gz4621
3. Re:读高性能MySQL(第4版)笔记12_查询性能优化(下)
@东围居士 建议读新版。...
--躺柒
4. Re:读高性能MySQL(第4版)笔记12_查询性能优化(下)
第4版相比第3版好像缩减了好多内容?楼主推荐第3版还是第4版
--东围居士
5. Re:读Java性能权威指南(第2版)笔记18_垃圾回收E
@屠炉 没有用第三方工具,手动的。 有几个平台直接支持markdown导入,只是要调整一下图片上传即可。...
--躺柒
点击右上角即可分享
支持DeepSeek的编程助手
【推荐】编程新体验,更懂你的AI,立即体验豆包MarsCode编程助手
【推荐】凌霞软件回馈社区,博客园 & 1Panel & Halo 联合会员上线
【推荐】抖音旗下AI助手豆包,你的智能百科全书,全免费不限次数
【推荐】博客园社区专享云产品让利特惠,阿里云新客6.5折上折
【推荐】轻量又高性能的 SSH 工具 IShell:AI 加持,快人一步
· 【.NET】调用本地 Deepseek 模型
· CSnakes vs Python.NET:高效嵌入与灵活互通的跨语言方案对比
· DeepSeek “源神”启动!「GitHub 热点速览」
· Plotly.NET 一个为 .NET 打造的强大开源交互式图表库
· 我与微信审核的“相爱相杀”看个人小程序副业
2023-07-12 选读SQL经典实例笔记05_日期运算(下)