2021 年 11月随笔档案 - 奶酥

26tensorflow基本使用

摘要：tensorflow基本使用想来想去，在实战前，还是先看一下tensorflow的基本使用。理解TensorFlow 使用图(graph)来表示计算任务；在被称之为会话（Session）的上下文（context）中执行图；使用tensor（张量）表示数据；通过变量（Variable）维护状阅读全文

posted @ 2021-11-18 21:03 奶酥阅读(219) 评论(0) 推荐(0) 编辑

25tensorflow

摘要：因为想搞的实战项目需要Tensorflow，之前用命令行已经安装过了，但是pycharm里没办法把Tensorflow导进来，已经两天了，额试了各种各样的方法，最后和同学讨论了一下，找了个教程再装。参考视频链接：https://www.bilibili.com/video/BV1B7411L7Qt 阅读全文

posted @ 2021-11-17 23:28 奶酥阅读(70) 评论(0) 推荐(0) 编辑

24相关库的介绍及安装

摘要：相关库的介绍及安装相关库的简介 tensorflow库 TensorFlow是谷歌2015年开源的一个人工智能学习系统。主要目的是方便研究人员开展机器学习和深度神经网络方面的研究，目前这个系统更具有通用性，也可广泛用于其他计算领域。 Tensorflow支持多种前端语言，包括Python（Pyth 阅读全文

posted @ 2021-11-11 19:27 奶酥阅读(66) 评论(4) 推荐(0) 编辑

23Flappy Bird自主学习程序基本框架

摘要：Flappy Bird自主学习程序基本框架用DQN实现程序基本框架程序与模拟器交互训练过程也就是神经网络（agent）不断与游戏模拟器（Environment）进行交互，通过模拟器获得状态，给出动作，改变模拟器中的状态，获得反馈，依据反馈更新策略的过程。训练过程训练过程过程主要分为以下三阅读全文

posted @ 2021-11-08 21:30 奶酥阅读(269) 评论(0) 推荐(0) 编辑

22实例分析Happy bird

摘要：实例：自主学习Flappy Bird游戏实例介绍深度强化学习 2013年，Deep Mind团队在NIPS上发表《PlayingAtari with Deep Reinforcement Learning》一文，在该文中首次提出Deep Reinforcement Learning—词，并且提出阅读全文

posted @ 2021-11-07 22:59 奶酥阅读(90) 评论(0) 推荐(0) 编辑

21强化学习

摘要：强化学习也称增强学习。强化学习就是程序或智能体（agent）通过与环境不断地进行交互学习一个从环境到动作的映射，学习的目标就是使累计回报最大化。强化学习是一种试错学习，因其在各种状态（环境）下需要尽量尝试所有可以选择的动作，通过环境给出的反馈（即奖励）来判断动作的优劣，最终获得环境和最优动作的阅读全文

posted @ 2021-11-01 21:31 奶酥阅读(383) 评论(0) 推荐(0) 编辑

奶酥

11 2021 档案

公告

搜索

常用链接

随笔分类

随笔档案

阅读排行榜

评论排行榜

最新评论