随笔分类 - 决策智能
摘要:序幕 童年经典游戏 80、90年代出生的人,红白机总是童年时光重要的记忆片段之一。几叠游戏盒,两个手柄,就可以开启一整天的欢乐时光,乐此不疲地探索各种红白机游戏中的玩法、机制、彩蛋。虽然只是2维平面上的像素头小人,虽然只是“上上下下左右左右BABA”这般的简单按键,但依然被玩家们开发出了各种精彩纷呈
阅读全文
摘要:引言 探索和利用的平衡 (The banlance between exploration and exploitation) 是强化学习中最核心的问题之一。 一般来说,利用指的是利用当前已知知识做出最优动作,探索指的是探索未知的环境以获取新的知识,从而潜在地可能得到回报更大的动作。探索与利用如何平
阅读全文
摘要:引言 如果想要将强化学习技术应用在某个决策领域,最重要的就是将原始问题转换为一个合理的 MDP (马尔科夫决策过程)问题,而一旦问题环境本身有一些不那么友好的”特性“(比如部分可观测,非平稳过程等等),常规强化学习方法的效果便可能大打折扣。另一方面,随着近些年来数据驱动范式的发展,大数据和预训练大模
阅读全文
摘要:在当今信息大爆炸的时代,人们已越来越多地习惯用视频的形式传达信息,在Youtube上每分钟就有超过300小时的视频上传。而且在媒介形式中,视频相较于图片有着更大的使用场景和应用范围。自动识别这些海量视频中的人类行为、事件、紧急情况等内容,对于视频推荐、监控预警等实际应用具有重要意义。近年来,已有很多
阅读全文
摘要:引言 自动驾驶领域近几年来一直备受关注,但截止目前,自动驾驶在现实复杂场景下的大规模部署应用却一再延后。 其中一个很重要的原因是,目前业界对于动态和强交互性场景下的行为、轨迹预测问题(behavior prediction)始终没有得出很好的解决方案。缺乏对其他道路参与者的行为理解与预测,自动驾驶车
阅读全文
摘要:恢复内容开始 金磊 发自 凹非寺 量子位|公众号 QbitA 这年头,直播讲AI,真算不上什么新鲜事。但要是连职业电竞选手,都开播主讲呢?没开玩笑,是真事。 这位讲AI的主播,就是那个《星际争霸2》的虫王——IA。 然后,他讲AI的画风是这样的: 但有一说一,讲AI毕竟还是一件严谨的事儿。IA的这波
阅读全文