聚类 应用在无监督学习中。 X=[X1,X2,X3,,,,Xn] 上节课讲的降维实际是把每个数据的特征维度降低了,通过对数据本身进行分析,进行降维。 聚类,是在数据量这个角度 通过方法,对数据进行分析,找到K个代表,可以代表整个n个数据,n个数据归类到K个代表中。 聚类任务相关概念 定义:依据样本的 Read More
关系数据库 遍历查询,速度比较慢。 非关系型数据库:key 和value可以使用任意的数据类型,灵活性比较高,但是安全性比较弱,主要通过数据中心的操作来保护。一致性比较弱。 一致性、可用性、容错性。 select "name" from "table" "name"一般会设置有一个白名单。 总结:关 Read More
虚拟内存空间 好处: 好处一:内存效率会提升。好处二:进程间可以实现共享。 虚拟内存:逻辑地址,得到页表项,然后得到物理地址。 如果找到了这一页,在逻辑地址里面,则正常;否则就会产生缺页异常,可能是一个非法页,然后产生中断,异常处理程序,做上下文保存和恢复。操作系统做这个缺页异常:OS判断这个页是不 Read More
5734. 判断句子是否为全字母句 全字母句 指包含英语字母表中每个字母至少一次的句子。给你一个仅由小写英文字母组成的字符串 sentence ,请你判断 sentence 是否为 全字母句 。如果是,返回 true ;否则,返回 false 。来源:力扣(LeetCode)链接:https://l Read More
无监督降维 无监督有三类:降维、聚类、概率建模。 本节课主要讲降维和聚类。PCA(主成分分析) 降维的主要应用:一、数据可视化(Scatter plot)直接去掉某个维度会丢失大量数据信息。 降维具有如下一些优点: 1) 使得数据集更易使用。 2) 降低算法的计算开销。 3) 去除噪声。 4) 使得 Read More
EC2 亚马逊弹性计算云(EC2,Elastic Compute Cloud)是一个让使用者可以租用云端电脑运行所需应用的系统。 弹性负载均衡 监控服务 自动缩放 参考链接:https://baike.baidu.com/item/%E4%BA%9A%E9%A9%AC%E9%80%8AEC2/916 Read More
内存管理基础 CPU与Memory之间进行读写操作。 函数接口: 值=read(address) write(address,value) 编译并行化:现在是把可执行程序包含的库等全部链接起来。主要的过程有:编译、集会、链接、加载。 静态链接 动态链接 动态加载:现在一般自己不用这个技术了,是比较早 Read More
卷积神经网络 传统监督学习过程:y = h(x) 图像作为输入的神经网络: 减少参数量:1神经元局部的连接,关注图像局部特征2空间上参数共享,保持图形特征的空间信息; 相关运算: 2维相关运算:h = filter2(f,I) h(x,y) = F& I(x,y) 卷积运算:同一个神经元作用于图像所 Read More
第六讲Amazon Dynamo 基础存储结构Dynamo Dynamo中使用改进后的一致性哈希算法,并在此基础上进行数据备份,以提高系统的可用性。 一致性哈希算法:<keys,hashs>,存在的问题:可能造成一个结点存储大量的数据;服务器性能有差异,怎么均衡 数据均衡分布的问题:Dynamo引入 Read More
深度学习是什么? 机器学习与深度学习 早期:感知机 中期:神经网络 非神经网络时期 现代:深度学习 生物神经元和感知器 MP神经元模型 输入:其他n个神经元传递过来的输入信号。 处理:输入信号通过带权重的连接进行传递。 错误预测的代价 损失函数—交叉熵(用于输出值为0-1的模型) J(W)= 真实的 Read More