随笔分类 -  AI

随便玩玩
摘要:AI | 强化学习 | qlearning 之前跟着莫烦python用numpy和pandas来做强化学习的qtable,感觉pandas太反人类了,这次把他课上的例子用python原生的字典来做qtable重新写了一份,便于理解。 代码如下: import time import random N 阅读全文
posted @ 2023-01-01 16:04 Mz1 阅读(55) 评论(0) 推荐(0) 编辑
摘要:AI | 强化学习 | Sarsa 首先感谢莫烦大佬的公开教程。 https://github.com/MorvanZhou/Reinforcement-learning-with-tensorflow sarsa是强化学习中的一种,属于在线学习。【走到哪一步学哪一步】 和qlearning类似,但 阅读全文
posted @ 2022-12-30 14:41 Mz1 阅读(93) 评论(0) 推荐(0) 编辑
摘要:Q LEARNING 强化学习 参考来源:bilibili@莫烦python 基本算法: 示例代码: import numpy as np import pandas as pd import time N_STATES = 6 # 世界的最大长度 ACTIONS = ['left', 'right 阅读全文
posted @ 2022-01-12 19:42 Mz1 阅读(27) 评论(0) 推荐(0) 编辑
摘要:默认情况下,Python 拥有以下数据类型: strings - 用于表示文本数据,文本用引号引起来。例如 "ABCD"。 integer - 用于表示整数。例如 -1, -2, -3。 float - 用于表示实数。例如 1.2, 42.42。 boolean - 用于表示 True 或 Fals 阅读全文
posted @ 2021-09-24 10:24 Mz1 阅读(124) 评论(0) 推荐(0) 编辑
摘要:Numpy中的数组对象称为 ndarray , 目标就是快。 安装 pip install numpy 实例测试 一般可能会这样导入 import numpy as np 检查numpy版本:np.version 创建numpy ndarray对象 使用array()函数来进行创建 使用数组、元组等 阅读全文
posted @ 2021-09-24 10:15 Mz1 阅读(32) 评论(0) 推荐(0) 编辑