摘要:
title: 强化学习环境gym/gymnasium下的atari环境的v0、v4、v5的说明 description: #多个标签请使用英文逗号分隔或使用数组语法 tags: 杂谈 #多个分类请使用英文逗号分隔或使用数组语法,暂不支持多级分类 声明: 本文是最新版gym-0.26.2下Atari环 阅读全文
2024年10月16日
摘要:
title: 强化学习:gym下atari游戏环境的官方文档地址 description: #多个标签请使用英文逗号分隔或使用数组语法 tags: 杂谈 #多个分类请使用英文逗号分隔或使用数组语法,暂不支持多级分类 2024年10月16日 共建议查看两个历史上的官方地址: https://ale.f 阅读全文
摘要:
title: 非加密哈希函数库-SpookyHash description: #多个标签请使用英文逗号分隔或使用数组语法 tags: 杂谈 #多个分类请使用英文逗号分隔或使用数组语法,暂不支持多级分类 地址: https://burtleburtle.net/bob/hash/spooky.htm 阅读全文
摘要:
title: 大部分的强化学习环境都是确定性的,那么如何解决训练过程中环境的确定性与实际问题要求的随机性之间的差距呢? description: #多个标签请使用英文逗号分隔或使用数组语法 tags: 杂谈 #多个分类请使用英文逗号分隔或使用数组语法,暂不支持多级分类 提出一个问题: 大部分的强化学 阅读全文
2024年10月14日
摘要:
title: 强化学习性能指标之一:以训练的episodes数和训练所需样本数作为评价算法性能的指标 description: #多个标签请使用英文逗号分隔或使用数组语法 tags: 杂谈 #多个分类请使用英文逗号分隔或使用数组语法,暂不支持多级分类 在强化学习领域,一般都是限定训练的episode 阅读全文
摘要:
title: 机器学习领域如何判定算法是否收敛(算法是否稳定) description: #多个标签请使用英文逗号分隔或使用数组语法 tags: 杂谈 #多个分类请使用英文逗号分隔或使用数组语法,暂不支持多级分类 最近在看ML的资料的时候看到有关算法收敛的讨论,然后有些资料并没有说明如何判定算法是否 阅读全文
2024年10月13日
摘要:
title: 长期角度来看股票市场上赚钱的人所赚的钱就是那些赔钱的人所赔的那些钱 description: #多个标签请使用英文逗号分隔或使用数组语法 tags: 杂谈 #多个分类请使用英文逗号分隔或使用数组语法,暂不支持多级分类 最近我国股票市场上的剧烈波动引起了我的一些关注,毕竟不论是出去吃饭还 阅读全文
摘要:
title: 中美两国在科技创新上受资金支持形式不同所造成的差距因素 description: #多个标签请使用英文逗号分隔或使用数组语法 tags: 杂谈 #多个分类请使用英文逗号分隔或使用数组语法,暂不支持多级分类 胡思乱想: 中国的科研几乎是完全国家主导的,虽然也有些公司后来也慢慢有了部门的科 阅读全文
摘要:
title: 体制内运气是否很重要——读博是否运气很重要? description: #多个标签请使用英文逗号分隔或使用数组语法 tags: 杂谈 #多个分类请使用英文逗号分隔或使用数组语法,暂不支持多级分类 相关: 体制内没背景无出头之日?张雪峰肺腑之言 不论是在体制内还是在读博,有些事情真的很玄 阅读全文
摘要:
title: 如何在cnblogs的发文中使用自定义地址作为发文链接 description: #多个标签请使用英文逗号分隔或使用数组语法 tags: 杂谈 #多个分类请使用英文逗号分隔或使用数组语法,暂不支持多级分类 要知道在cnblogs中发表内容后其默认的链接地址都是一串数字的形式,比如本篇的 阅读全文