范加索尔拉

2021年10月14日

摘要： > git clone http://github.com/ndevilla/iniparser.git > cd iniparser > make > sudo cp libiniparser.* /usr/lib/ > sudo cp src/iniparser.h /usr/local/inc 阅读全文

posted @ 2021-10-14 00:36 范加索尔拉阅读(371) 评论(0) 推荐(1)

2019年2月26日

DQN(Deep Reiforcement Learning) 发展历程（五）

摘要： [toc] "DQN发展历程(一)" "DQN发展历程(二)" "DQN发展历程(三)" "DQN发展历程(四)" "DQN发展历程(五)" 值函数的近似当状态动作数目太多时，使用表格存储所有的状态动作会造成维度灾难，无法求解大规模问题。可以采用一个函数来近似这个这个表格，输入状态动作，输阅读全文

posted @ 2019-02-26 11:28 范加索尔拉阅读(897) 评论(0) 推荐(0)

DQN(Deep Reiforcement Learning) 发展历程（三）

摘要： [toc] "DQN发展历程(一)" "DQN发展历程(二)" "DQN发展历程(三)" "DQN发展历程(四)" "DQN发展历程(五)" 不基于模型(Model free)的预测无法事先了解状态转移的概率矩阵蒙特卡罗方法从开始状态开始，到终结状态，找到一条完整的状态序列，以求解每个状态的值阅读全文

posted @ 2019-02-26 11:27 范加索尔拉阅读(805) 评论(0) 推荐(0)

DQN(Deep Reiforcement Learning) 发展历程（四）

摘要： [toc] "DQN发展历程(一)" "DQN发展历程(二)" "DQN发展历程(三)" "DQN发展历程(四)" "DQN发展历程(五)" 不基于模型的控制选取动作的方法贪婪法，每次控制都选择状态值最大的动作，容易局部收敛，找不到全局最优。引入 epsilon greedy，按 epsilo 阅读全文

posted @ 2019-02-26 11:27 范加索尔拉阅读(554) 评论(0) 推荐(0)

DQN(Deep Reiforcement Learning) 发展历程（二）

摘要： [toc] "DQN发展历程(一)" "DQN发展历程(二)" "DQN发展历程(三)" "DQN发展历程(四)" "DQN发展历程(五)" 动态规划动态规划给出了求解强化学习的一种方式使用条件使用动态规划需要两个条件总问题可以分解成一系列相互重叠的子问题子问题的求解结果被存储下来并且可以阅读全文

posted @ 2019-02-26 11:26 范加索尔拉阅读(668) 评论(0) 推荐(0)

DQN(Deep Reiforcement Learning) 发展历程(一)

摘要： [toc] "DQN发展历程(一)" "DQN发展历程(二)" "DQN发展历程(三)" "DQN发展历程(四)" "DQN发展历程(五)" 马尔可夫理论马尔可夫性质 P[St+1 | St] = P[St+1 | S1,...,St] 给定当前状态 St ，过去的状态可以不用考虑当前状态 St 阅读全文

posted @ 2019-02-26 11:24 范加索尔拉阅读(2013) 评论(0) 推荐(0)

2019年2月10日

2019寒假训练营第三次作业

摘要： 2019寒假训练营第三次作业 Deadline：2.18 23:00 出题人：福州大学计算机科学与技术周政演学习视频课程(20') 学习福州大学网络课程 "网络空间安全概论" ，形成学习笔记，发布专门博客，至少完成第五章的视频学习。或学习密歇根大学的网络课程 "Internet hist 阅读全文

posted @ 2019-02-10 12:33 范加索尔拉阅读(289) 评论(0) 推荐(0)

2019年1月28日

2019寒假训练营第二次作业

摘要： 2019寒假训练营第二次作业 Deadline：2.3 23:00 学习视频课程(20') 学习福州大学网络课程 "网络空间安全概论" ，形成学习笔记，发布专门博客，至少完成第一、二周的视频学习。或学习密歇根大学的网络课程 "Internet history" ，形成学习笔记，另外发布专门的博客。阅读全文

posted @ 2019-01-28 11:09 范加索尔拉阅读(254) 评论(0) 推荐(0)

2019寒假训练营第一次作业

摘要： 2019寒假训练营第一次作业 Deadline：2019 01 26 23：00 括号中为评分标准。 1. 在 "博客园" 上注册、开设技术博客，并关注以下博客：(10') 2. 随笔和学习笔记使用 Markdown 格式，Markdown工具建议使用跨平台的知识管理工具 "有道云笔记" ， "M 阅读全文

posted @ 2019-01-28 11:08 范加索尔拉阅读(266) 评论(0) 推荐(0)

2019年1月8日

软件工程实践总结

摘要：一、请回望暑假时的第一次作业，你对于软件工程课程的想象 1）对比开篇博客你对课程目标和期待，“希望通过实践锻炼，增强计算机专业的能力和就业竞争力”，对比目前的所学所练所得，在哪些方面达到了你的期待和目标，哪些方面还存在哪些不足，为什么？创新能力：这一项能力其实是我在课前没有考虑到的。从个人、结对编阅读全文

posted @ 2019-01-08 11:54 范加索尔拉阅读(291) 评论(2) 推荐(0)

公告