随笔分类 - 人工智能
摘要:强化学习下两类:有模型和无模型。意思就是字面意思,就是算法里有没有网络模型。 没有模型的强化算法有: Q-learning, Sarsa. (PS: 垃圾中的战斗机,了解就行, 有一个Q表,不停迭代) 有模型的强化算法有: 有太多了,没有必要纠结。 常见的就是DQN家族算法,PPO,A2C, A3C
阅读全文
摘要:假设有一个过程: 状态S1 -> 状态S22 -> 状态S33 -> 状态S 如果上面的过程加一个条件,下一个状态只与当前状态有关, 那么可以理解为这个过程就是马尔可夫过程 说明:当前状态S1到下一个状态S22只是其中一个路径,到下一状态还有可能是S21. S23 等等。。。 依此类推 大脑可以想象
阅读全文
摘要:情景一: 假设股价初始价格为100元, 则第一次投入2000元买入的数量为20股, 第一次下降10%,价格变为90元,账户价值为20股 * 90元/股 = 1800元。 对股价来说下降了10% 对用户来说亏了10% 第二次投入3000元买入的数量为33.33股。 第二次下降12%,价格变为79.2元
阅读全文
摘要:#coding:utf-8 from sklearn.neural_network import MLPRegressor from sklearn.model_selection import train_test_split from sklearn.metrics import mean_sq
阅读全文
摘要:from sklearn.neural_network import MLPRegressor import numpy as np # 创建神经网络对象 # 使用adam优化器 adam是一种梯度下降算法 # 使用sgd优化器 adam是一种随机梯度下降算法 model = MLPRegresso
阅读全文
摘要:import numpy as np class NeuralNetwork: def __init__(self, input_size, output_size): self.input_size = input_size self.output_size = output_size self.
阅读全文
摘要:#coding: utf8 import math # x1, x2输入神经元 x1=1 x2=2 # w1,w2分别为x1,x2的权重 w1=0.2 w2=0.3 # b为输出神经元的偏移量 b = 0.1 target = 1 # 目标值 def f(w1, w2, b): return x1
阅读全文
摘要:#coding=utf8 import json,math,requests import numpy as np import matplotlib.pyplot as plt from scipy.stats import gaussian_kde from scipy.integrate im
阅读全文
摘要:Q-Learning算法 理论 Q-Learning是一种强化学习算法,用于学习在给定状态下采取不同行动的最佳策略。其公式如下: $Q(s,a) \leftarrow (1 - \alpha) \cdot Q(s,a) + \alpha \cdot (r + \gamma \cdot \max_{a
阅读全文
摘要:-1% --> +1.0101% -2% --> +2.0408% -3% --> +3.0928% -4% --> +4.1667% -5% --> +5.2632% -6% --> +6.3830% -7% --> +7.5269% -8% --> +8.6957% -9% --> +9.890
阅读全文
摘要:https://blog.csdn.net/qq_41800366/article/details/86583789 根据这篇文章,根据自己的理解,实际应用了一下梯度下降 #coding:utf-8 import numpy as np w = 2 b = 2 lr = 0.01 # 学习率 not
阅读全文
摘要:强化学习就是评价学习,这个和深度学习有啥区别? 我个人理解就是深度学习需要对一个一组特征设置标签, 然后反复训练模型,是这个模型尽量接近 一坨特征数据等于标签。 而强化学习是对一坨特征,模型刚开始不知道标签是具体是啥,随便输出一个值y就行,然后我们实现一个奖励函数,对这个输出值打一个分, 分数越高,
阅读全文
摘要:随机生成基金数据, 涨幅服从的分布和中欧基金的分布一致 import numpy as np from sklearn.neighbors import KernelDensity import pandas as pd import seaborn as sns import matplotlib
阅读全文
摘要:import numpy as np import pandas as pd import seaborn as sns import matplotlib.pyplot as plt data=[0,0,-0.7071,0.5086,-0.3036,-0.1015,0.1016,-0.203,-0
阅读全文
摘要:我做了一个预测, 根据前100天的涨幅,预测第101天在哪个分段位。 将涨幅分了5个等级 设涨幅为x x>=1.5. 为 0 段 x>=0.5. 为 1 段 x>=-0.25 为 2 段 x>=-1.25 为 3 段 x<-1.25 为 4 段 T = [1.5, 0.5, -0.25, -1.25
阅读全文
摘要:之前一直在关注中欧医疗健康这支基金,收益还不错,于是想通过数学的方法分析,基金涨幅服从什么分布。 首先是一坨涨幅数据, 2016-11-07到2021-07-29 这期间的涨幅. 单位都是百分比 [0,0,-0.7071,0.5086,-0.3036,-0.1015,0.1016,-0.203,-0
阅读全文
摘要:import gym env = gym.make('KellyCoinflip-v0') from scipy.stats import binom import numpy as np from repoze.lru import lru_cache def V(w, b, m=250): if
阅读全文
摘要:sum_weights 可以通过参数设置。 如果不设置,那么值就是样本的个数。 指定每个样本的权重。 我突然想到基金预测,可以设置样本的权重。 真实涨幅越高,权重越小。 反之,权重越高。 因为如果预测偏低,那么loss 损失越大。 "rmse": sum_loss = 和 (score - labe
阅读全文
摘要:2020年11月30日之前的历史数据。 12月1号买入后, 过一个星期的涨幅 预测结果:JJ.240022 0.037074682566729036JJ.000336 0.035307269171717996JJ.540003 0.033018412484014305JJ.000219 0.0329
阅读全文