摘要:
梯度下降法作为一种反向传播算法最早在上世纪由geoffrey hinton等人提出并被广泛接受。最早GD由很多研究团队各自独立提出来,可大都无人问津,而hinton做的研究完整表述了GD方法,同时hinton为自己的研究多次走动人际关系使得其论文出现在了当时的《nature》上,因此GD得到了第一次 阅读全文
摘要:
本文仅对常见的无监督学习算法进行了简单讲述,其他的如自动编码器,受限玻尔兹曼机用于无监督学习,神经网络用于无监督学习等未包括。同时虽然整体上分为了聚类和降维两大类,但实际上这两类并非完全正交,很多地方可以相互转化,还有一些变种的算法既有聚类功能又有降维功能,一些新出现的和尚在开发创造中的无监督学习算 阅读全文
摘要:
公式 链接 http://infolab.stanford.edu/~backrub/google.html https://zh.wikipedia.org/wiki/PageRank 阅读全文
摘要:
这是一个 Point in Polygon Test问题。 问题建模 输入: 点变量(用来描述待测试点),点变量数组(用来描述封闭图形),整型变量(用来描述封闭图形的边数)。 输出: bool值(用来描述点是否在封闭图形内)。 测试定理为: 如果从点发出的射线穿过封闭图形边的数量为奇数,则点在图形内 阅读全文
摘要:
基本搜索 与 直接空格分开就好。 像我这样的人 李正尧 或 树哥 OR李正尧 包含“李正尧”或者“树哥”、或者两者均有的中英文网站. 排除 年轻有为 -李正尧 *匹配 例如国家 匹夫*, google搜索会自动匹配出“国家兴亡,匹夫有责”结果。 高级搜索 1 site:可以查询某个网站页面的收录情况 阅读全文
摘要:
目的 随机打乱一个数组 code #include <bits/stdc++.h> using namespace std; void knuth_shuffle(int *arr, int n) { for (int i = n - 1; i > 1; i--) swap(arr[i], arr[ 阅读全文
摘要:
回显 toilet 艺术字 游戏 nsnake 贪吃蛇 bastet 俄罗斯方块 查看这台机器的信息 CPU详细信息 cat /proc/cpuinfo 当前内存的详细情况 cat /proc/meminfo 外存详细情况 sudo fdisk -l 外存挂载情况 sudo ls /mnt 所有PC 阅读全文
摘要:
Shell shell就是一个进程,这个进程的工作就是接收键盘输入,并parser到相应的系统调用,执行系统调用. 操作系统是如何管理外存设备的? 操作系统是如果操作外存的? 问题引入 为什么使用外存? 为什么需要内存呢?因为寄存器空间太小了,不够用啊!需要内存来给它补充缓冲。同理,外存也为内存补充 阅读全文
摘要:
操作系统是如何安排网络通信的 操作系统内部实现了socket()系列的系统调用,以供进程进行网络通信。 简单讲,调用socket()系列函数后,会按照用户所传参数选择指定协议,通过调用操作系统内部的协议实现来包装待传输信息,然后I/O走网络总线传送到网卡上,网卡再完成链路层和物理层封装,与外界进行交 阅读全文
摘要:
我们思考这几个问题: 操作系统kernel要如何实现多处理器支持? 用户进程能不能由用户进程创建?怎么实现?提到fork()、exec()你想到什么? 操作系统kernel要如何支持多进程?你设计的多进程调度可能在哪些地方会有性能弊端?如何去改进? 你的kernel支持了多进程,那两个(多个)用户进 阅读全文
摘要:
相关源文件 inc/ env.h Public definitions for user-mode environments trap.h Public definitions for trap handling syscall.h Public definitions for system cal 阅读全文
摘要:
Physical Page Management JOS内核以页为最小粒度管理内存,从而实时记录哪些内存区域空闲,哪些内存区域占用,这个信息被记录在一条结构体PageInfo的链表中,链表的每个结点对应一个物理页。 内核开始,会调用mem_init()函数对整个操作系统的内存管理系统进行一些初始化的 阅读全文
摘要:
从机器上电到运行OS发生了什么? 在电脑主板上有一个Flash块,存放了BIOS的可执行代码。它是ROM,断电不会丢掉数据。在机器上电的时候,CPU要求内存控制器从0地址读取数据(程序第一条指令)的时候,内存控制器去主板上的BIOS所在ROM读取数据,此时CPU运行着BIOS。这里BIOS主要做了以 阅读全文
摘要:
Intro 如果想省时间,建议直接看:Rainbow Deep Q Network(Vanilla DQN) 抓两个点: Replay Buffer Target Network 详细见:https://www.cnblogs.com/dynmi/p/13994342.html 更新evaluate 阅读全文
摘要:
Intro 交叉熵,用来衡量两个随机变量之间的相似度。 KL散度(相对熵),量化两种概率分布P和Q之间差异。 计算公式 交叉熵 \(CE(p,q) = - (\sum_{i=1}^{n}[p_{i}*log(q_{i}) + (1-p_{i})*log(1-q_{i})])\) KL散度 \(D_{ 阅读全文