摘要:
背景 强化学习是机器学习三大分支之一,除去强化学习外,还有监督式学习和非监督式学习,虽然本系列文章主要介绍强化学习,但是了解另外两类的特点还都是很有必要。本系列的文章首先整体介绍强化学习的相关知识,然后是相关的算法,第一个算法是Q-Learning。 监督式学习 监督式学习好比有一位老师告诉机器某个 阅读全文
摘要:
前言 在本篇文章中将介绍奖励与策略结构相关的知识,这一部分是强化学习的极重要一部分,因此会有较长篇幅介绍。 奖励 奖励是代理不断完善自己,使自己能够自主实现目标的直接经验来源。代理通过接受来自环境奖励判断自己行为地好坏,从而通过更大可能的选择收益高的行为使自己趋于目标状态。好比老师为你的行为打的分数 阅读全文
摘要:
前言 接下来会对环境进行阐述,该文章内容和较少,但为保证系列文章完整性因此考虑独立写出来。 环境的概述 在前面的文章中提到,环境是代理玩耍的场所,代理做出动作作用于环境,环境会像一个老师对代理所做的动作打分(奖励Reward),同时代理可以观察环境得到状态,也叫观察。 环境分类 环境主要有两大类,物 阅读全文
摘要:
时钟系统 概述 MSP430G2系列单片机主打低功耗,但同时需要满足其他外设的时钟需求,因此内部有多个时钟源可供使用者选择,若要实现低功耗,便可选择低频率,如需要满足高速的外设,便可选择高频率。 时钟源 MSP430G2553共有三大时钟源,三大时钟信号。 时钟源:内部低频时钟源LFXT1 、内部数 阅读全文
摘要:
题目 创建一个长度可由用户输入的数组,存入10-99不重复的数,要求用户输入在另外一个线程实现,并按升序输出; 代码 Thread1类,负责输入 public class Thread1 implements Runnable { @Override public void run() { Scan 阅读全文
摘要:
一、程序、进程、线程 程序 为了解决某个问题、实现某个功能用某种编程语言编写的代码文件,是静态的;(例如在本地未运行的各种应用程序QQ、微信等); 进程 当程序被运行,程序由静态变为动态,就会产生相应的进程,是动态的,有生命周期;(例如打开QQ程序,就会有QQ的进程); 线程 是程序的一次执行过程, 阅读全文
摘要:
题目 实现数组复制,把一个数组的值,复制到另一个数组中。 分析 System.arraycopy(src, srcPos, dest, destPos, length) src: 源数组 srcPos: 从源数组复制数据的起始位置 dest: 目标数组 destPos: 复制到目标数组的起始位置 l 阅读全文
摘要:
题目 小明在银行存钱,每年20%的投资回报率。以每个月投资1000块钱的节奏,持续投资多少年,总金额达到100万(复利计算按照每年12000投入计算,不按照每月计息) 复利公式: F = p* ( (1+r)^n ); F 最终收入 p 本金 r 年利率 n 存了多少年 分析 每个月投入1000,一 阅读全文
摘要:
一、直接插入排序 思想:假设待排数据有n个,将待排序列分为有序和无序两个部分,初始时,有序部分仅有一个数据即为第一个数据,其余n-1个数据为无序序列,然后将无序序列的每个数据分别与有序序列的每个数据比较,插入到合适位置。(无序序列数据从有序序列最后一个数开始往前比较)。 例如: 分析:我们考虑最坏的 阅读全文
摘要:
一、数组概念 数组即为多个相同数据类型数据的数据按一定顺序排列的集合。 二、数组的特点 1、数组有数组名、索引、元素、素组长度; 2、数组的元素可以是基本数据类型也可以是引用数据类型; 3、数组的长度一旦确定便不可更改; 4、数组的在内存中表现为连续的存储单元,数组名引用的是首地址; 三、数组分类 阅读全文