yangyang12138

导航

2019年12月19日 #

tensorflow(一)

摘要: 一、安装 pip install tensorflow 二、简介 tensor是张量的意思,flow是流动 张量是数据的载体,包括标量,向量,矩阵,数据立方,n维的数据 tensorflow的数据流图,用节点和有向边描述数学运算的有向无环图,图中节点代表操作,具体包括数学运算,数据填充,结果输出和变 阅读全文

posted @ 2019-12-19 02:45 杨杨09265 阅读(997) 评论(0) 推荐(0) 编辑

2019年12月18日 #

lucene

摘要: 1.索引建立过程 生成write.lock文件, 然后生成fdt,fdx文件 在lucene中,fdt与fdx文件都是在FieldsWriter中生成的。对于每个Document,解析其Fields中的内容后(这个解析过程是比较复杂的,包括分词等操作,后面详细讨论),把Document中的Field 阅读全文

posted @ 2019-12-18 00:58 杨杨09265 阅读(235) 评论(0) 推荐(0) 编辑

2019年12月17日 #

线性回归-最小二乘法求解

摘要: 1. 概述: 线性回归是利用数理统计中回归分析,来确定两种或两种以上变量间相互依赖的定量关系的一种统计分析方法,运用十分广泛。 其表达形式为y = w'x+e。 demo: 对于一组数据{ (100,20),(160,30),),(60,15)………… },假定x,y之间满足某种线性关系。给出目标函 阅读全文

posted @ 2019-12-17 00:00 杨杨09265 阅读(747) 评论(0) 推荐(0) 编辑

2019年12月14日 #

决策树和随机森林

摘要: 决策树是一种非参数监督学习预测模型。 决策树是一种树形结构,其中每个内部节点表示一个属性上的测试,每个分支代表一个测试输出,每个叶节点代表一种类别。 1.举例: 举个校园相亲的例子,今天校园的小猫(女)和小狗(男)准备配对,小猫如何才能在众多的优质🐶的心仪的狗呢?于是呢?有一只特乖巧的小猫找到了你 阅读全文

posted @ 2019-12-14 17:44 杨杨09265 阅读(294) 评论(0) 推荐(0) 编辑

隐马尔可夫随机场HMM

摘要: 概率知识点: 0=<P(A)<=1 P(True)=1;P(False)=0 P(A)+P(B)-P(A and B) = P(A or B) P(A|B)=P(A,B)/P(B) => P(A,B)=P(A|B)P(B) =>P(A,B,C) = P(A|B,C)P(B|C)P(C) 如果A,B 阅读全文

posted @ 2019-12-14 01:30 杨杨09265 阅读(309) 评论(0) 推荐(0) 编辑

2019年12月12日 #

svm支持向量机

摘要: 线性可分支持向量机 指可以在两个分类的数据点之间找到一个超平面(WTx + b = 0),使得两个分类与该平面的最小距离相等, 其中离该平面最近的点就是支撑向量,即WTx+b=1或WTx+b=-1 y(xn)=WTx+b y(xn)>0 tn=1 y(xn)<0 tn=-1 =>tn*y(xn)>0 阅读全文

posted @ 2019-12-12 22:07 杨杨09265 阅读(469) 评论(0) 推荐(0) 编辑

2019年12月11日 #

adaboost

摘要: Adaboost是一种迭代算法,其核心思想是针对同一个训练集训练不同的分类器(弱分类器),然后把这些弱分类器集合起来,构成一个更强的最终分类器(强分类器)。 过程: 首先对于向量{XT,y},给定初始权值1/N,目标函数 y=sign(amGm(x)),其中am初始为1,首次Gm(x)可以凭经验给出 阅读全文

posted @ 2019-12-11 16:47 杨杨09265 阅读(233) 评论(0) 推荐(0) 编辑

2019年12月10日 #

pca和svd

摘要: pca主要用于去噪,降纬。 pca的主要功能就是在最大成都上保留原有数据特征的前提下缩减数据的纬度。 过程:对于矩阵A,首先求它的协方差矩阵,然后求协方差矩阵的特征向量,特征向量对应的特征值排序, 取前几个特征值对应的特征向量构成的新向量构成的矩阵B,AB得到的新矩阵即为目标矩阵。 svd又叫奇异值 阅读全文

posted @ 2019-12-10 18:03 杨杨09265 阅读(578) 评论(0) 推荐(0) 编辑

2019年9月6日 #

hive

摘要: hive是一个基于hdfs的数据库,用于大数据量存储,也可以理解为mr的一个sql引擎。 外部通过http调用,传入sql,hive的sql引擎首先会分词,然后根据语法解析语法树ASTNode, 然后经过BaseSemanticAnalyzer的自子类将语法树解析为可执行的tasks。 BaseSe 阅读全文

posted @ 2019-09-06 18:48 杨杨09265 阅读(268) 评论(0) 推荐(0) 编辑

2019年8月21日 #

hbase

摘要: 代码版本0.89 1.master RegionManager负责管理在线的region,以及region的上线、下线操作。 ServerManager负责管理在线的HServerInfo,包括握手操作。 Scanner用于遍历region数据。 rpc服务,客户端使用的服务就是通过调用的此服务。 阅读全文

posted @ 2019-08-21 02:31 杨杨09265 阅读(127) 评论(0) 推荐(0) 编辑