11 2021 档案
摘要:tensorflow基本使用 想来想去,在实战前,还是先看一下tensorflow的基本使用。 理解TensorFlow 使用图(graph)来表示计算任务; 在被称之为会话(Session)的上下文(context)中执行图; 使用tensor(张量)表示数据; 通过变量(Variable)维护状
阅读全文
摘要:因为想搞的实战项目需要Tensorflow,之前用命令行已经安装过了,但是pycharm里没办法把Tensorflow导进来,已经两天了,额试了各种各样的方法,最后和同学讨论了一下,找了个教程再装。 参考视频链接:https://www.bilibili.com/video/BV1B7411L7Qt
阅读全文
摘要:相关库的介绍及安装 相关库的简介 tensorflow库 TensorFlow是谷歌2015年开源的一个人工智能学习系统。主要目的是方便研究人员开展机器学习和深度神经网络方面的研究,目前这个系统更具有通用性,也可广泛用于其他计算领域。 Tensorflow支持多种前端语言,包括Python(Pyth
阅读全文
摘要:Flappy Bird自主学习程序基本框架 用DQN实现 程序基本框架 程序与模拟器交互 训练过程也就是神经网络(agent)不断与游戏模拟器(Environment)进行交互,通过模拟器获得状态,给出动作,改变模拟器中的状态,获得反馈,依据反馈更新策略的过程。 训练过程 训练过程过程主要分为以下三
阅读全文
摘要:实例:自主学习Flappy Bird游戏 实例介绍 深度强化学习 2013年,Deep Mind团队在NIPS上发表《PlayingAtari with Deep Reinforcement Learning》一文,在该文中首次提出Deep Reinforcement Learning—词,并且提出
阅读全文
摘要:强化学习 也称增强学习。 强化学习就是程序或智能体(agent)通过与环境不断地进行交互学习一个从环境到动作的映射,学习的目标就是使累计回报最大化。 强化学习是一种试错学习,因其在各种状态(环境)下需要尽量尝试所有可以选择的动作,通过环境给出的反馈(即奖励)来判断动作的优劣,最终获得环境和最优动作的
阅读全文