2018 年 10月 31 日随笔档案 - StarHai

2018年10月31日

摘要：一、前言在第一章强化学习简介中，我们提到强化学习过程可以看做一系列的state、reward、action的组合。本章我们将要介绍马尔科夫决策过程（Markov Decision Processes)用于后续的强化学习研究中。二、马尔科夫过程（Markov Processes） 2.1 马尔科夫阅读全文

posted @ 2018-10-31 23:20 StarHai 阅读(1856) 评论(0) 推荐(0) 编辑

BZOJ 3085: 反质数加强版SAPGAP

摘要： 3085: 反质数加强版SAPGAP Description 先解释一下SAPGAP=Super AntiPrime, Greatest AntiPrime（真不是网络流），于是你就应该知道本题是一个关于反质数（Antiprime）的问题。下面给出反质数的定义：将一个正整数i的约数个数记为g(i) 阅读全文

posted @ 2018-10-31 16:39 StarHai 阅读(341) 评论(0) 推荐(0) 编辑

BZOJ 1053 [HAOI2007]反素数ant

摘要： 1053: [HAOI2007]反素数ant Description 对于任何正整数x，其约数的个数记作g(x)。例如g(1)=1、g(6)=4。如果某个正整数x满足：g(x)>g(i) 0<i<x ，则称x为反质数。例如，整数1，2，4，6等都是反质数。现在给定一个数N，你能求出不超过N的最大的反阅读全文

posted @ 2018-10-31 16:21 StarHai 阅读(224) 评论(0) 推荐(0) 编辑

强化学习一：Introduction Of Reinforcement Learning

摘要：引言：最近和实验室的老师做项目要用到强化学习的有关内容，就开始学习强化学习的相关内容了。也不想让自己学习的内容荒废掉，所以想在博客里面记载下来，方便后面复习，也方便和大家交流。一、强化学习是什么？定义首先先看一段定义：Reinforcement learning is learning wh 阅读全文

posted @ 2018-10-31 00:29 StarHai 阅读(1676) 评论(0) 推荐(0) 编辑

StarHai

公告