摘要:
此文档主要为了自己查看方便,因为用git不是很多,但是又必须要用,其实挺简单的,节约自己以后的时间。 此操作的前提是已经在git中新建了项目 1. 首先在本地新建一个文件夹,把自己要上传的内容放到文件夹内。 2. 鼠标右键git bash here 3. 执行git init 4. 执行git cl 阅读全文
摘要:
本篇博客是对KNN关键知识点的总结,包括以下几个方面: 1.KNN原理介绍 kNN算法的核心思想是如果一个样本在特征空间中的k个最相邻的样本中的大多数属于某一个类别,则该样本也属于这个类别,并具有这个类别上样本的特性。该方法在确定分类决策上只依据最邻近的一个或者几个样本的类别来决定待分样本所属的类别 阅读全文
摘要:
代码分支管理规范 当需要开发新的功能时,需要从develop新建一个分支,当功能开发完成时,合并该分支到develop 综上:首先新建一个项目,项目中默认有master分支,在master分支上创建develop分支,在develop上创建Feature branches用于模块的开发,多个模块可以 阅读全文
摘要:
该部分内容主要介绍本体建模的几种方法,主要从以下几个方面介绍: 1.本体的意义 2.本体构建的几种方法 1.本体的含义 本体是指一种"形式化的,对于共享概念体系的明确而又详细的说明"。 本体提供的是一种共享词表,也就是特定领域之中那些存在着的对象类型或概念及其属性和相互关系。 2. 本体构建的几种方 阅读全文
摘要:
训练网络时往往会对全部的神经元参数进行微调,从而让训练结果更加准确。但在这个网络中,训练参数很多,每次微调上百万的数据是很浪费计算资源的。那么Negative Sampling方法可以通过每次调整很小的一部分权重参数,从而代替全部参数微调的庞大计算量。 词典D中的词在语料C中出现的次数有高有低,对于 阅读全文
摘要:
首先Hierarchical Softmax是word2vec的一种改进方式,因为传统的word2vec需要巨大的计算量,所以该方法主要有两个改进点: 1. 对于从输入层到隐藏层的映射,没有采取神经网络的线性变换加激活函数的方法,而是采用简单的对所有输入词向量求和并取平均的方法。 比如输入的是三个4 阅读全文
摘要:
word2vec是将词转化为向量的一个强大的工具,它是google在2013年推出的,其特点是将所有的词向量化,这样词与词之间就可以定量的去度量他们之间的关系。 word2vec一般分为CBOW与Skip-Gram两种模型,下面会分别对两种模型进行具体的介绍。 本文参考的内容会在文章的下方列出。 一 阅读全文
摘要:
第一次装mysql,也踩了几个坑,在这里记录一下,方便以后查看。 我的电脑是windows7系统,mysql安装的是5.7.22版本。mysql下载地址如下:点击打开链接,大家对应自己的系统版本安装。 下载完成后,解压到自己要安装的目录,Archive这个版本是不用安装的,只需要复制到相应的目录 阅读全文
摘要:
1.PageRank介绍 PageRank算法是1998年由斯坦福大学的学生Larry page和Sergrey Brin发明的,是Google搜索引擎的重要算法。目的是基于网络的互联性来客观地计算网页受欢迎程度或重要性。其背后有两个主要依据: (1)具有更多的传入链接的页面比具有较少的传入链接的页 阅读全文
摘要:
一 介绍 本系列文章主要介绍机器学习中集成学习的相关理论及代表算法,文章主要包括以下几个方面: 1. 集成学习的相关介绍 2. boosting相关算法原理 3. bagging相关算法原理 以下内容主要是对第一部分的集成学习的相关介绍展开描述。 俗话说“三个臭皮匠,赛过诸葛亮”,集成学习运用的正是 阅读全文