11 2021 档案

摘要:tensorflow基本使用 想来想去,在实战前,还是先看一下tensorflow的基本使用。 理解TensorFlow 使用图(graph)来表示计算任务; 在被称之为会话(Session)的上下文(context)中执行图; 使用tensor(张量)表示数据; 通过变量(Variable)维护状 阅读全文
posted @ 2021-11-18 21:03 奶酥 阅读(219) 评论(0) 推荐(0) 编辑
摘要:因为想搞的实战项目需要Tensorflow,之前用命令行已经安装过了,但是pycharm里没办法把Tensorflow导进来,已经两天了,额试了各种各样的方法,最后和同学讨论了一下,找了个教程再装。 参考视频链接:https://www.bilibili.com/video/BV1B7411L7Qt 阅读全文
posted @ 2021-11-17 23:28 奶酥 阅读(70) 评论(0) 推荐(0) 编辑
摘要:相关库的介绍及安装 相关库的简介 tensorflow库 TensorFlow是谷歌2015年开源的一个人工智能学习系统。主要目的是方便研究人员开展机器学习和深度神经网络方面的研究,目前这个系统更具有通用性,也可广泛用于其他计算领域。 Tensorflow支持多种前端语言,包括Python(Pyth 阅读全文
posted @ 2021-11-11 19:27 奶酥 阅读(66) 评论(4) 推荐(0) 编辑
摘要:Flappy Bird自主学习程序基本框架 用DQN实现 程序基本框架 程序与模拟器交互 训练过程也就是神经网络(agent)不断与游戏模拟器(Environment)进行交互,通过模拟器获得状态,给出动作,改变模拟器中的状态,获得反馈,依据反馈更新策略的过程。 训练过程 训练过程过程主要分为以下三 阅读全文
posted @ 2021-11-08 21:30 奶酥 阅读(269) 评论(0) 推荐(0) 编辑
摘要:实例:自主学习Flappy Bird游戏 实例介绍 深度强化学习 2013年,Deep Mind团队在NIPS上发表《PlayingAtari with Deep Reinforcement Learning》一文,在该文中首次提出Deep Reinforcement Learning—词,并且提出 阅读全文
posted @ 2021-11-07 22:59 奶酥 阅读(90) 评论(0) 推荐(0) 编辑
摘要:强化学习 也称增强学习。 强化学习就是程序或智能体(agent)通过与环境不断地进行交互学习一个从环境到动作的映射,学习的目标就是使累计回报最大化。 强化学习是一种试错学习,因其在各种状态(环境)下需要尽量尝试所有可以选择的动作,通过环境给出的反馈(即奖励)来判断动作的优劣,最终获得环境和最优动作的 阅读全文
posted @ 2021-11-01 21:31 奶酥 阅读(383) 评论(0) 推荐(0) 编辑

点击右上角即可分享
微信分享提示