摘要:
从今天起,小马哥每天都发表一篇关于Python的博文,知识范围由Python的0基础,逐渐到项目应用. 目的: 在分享中学习 每天的新博文都会加入到这里成为超链接,方便各位点击查阅. Python基础学习01 -- 列表与元组 阅读全文
摘要:
小马哥大数据基础专栏: 最简单的解释 MapReduce 思想, 最简单的 MapReduce 入门案例. 阅读全文
摘要:
Hadoop安装配置 环境 1, JDK8 --> 位置: /opt/jdk8 2, Hadoop2.10: --> 位置: /opt/bigdata/hadoop210 3, CentOS 7虚拟机试验集群规划 一,安装步骤 1, 解压缩 cd /opt/bigdata tar -zxvf had 阅读全文
摘要:
如果你之前没有学习过K最近邻算法,那今天几张图,让你明白什么是K最近邻算法。 先来一张图,请分辨它是什么水果 很多同学不假思索,直接回答:“菠萝”!!! 仔细看看同学们,这是菠萝么?那再看下边这这张图。 这两个水果又是什么呢? 这就是菠萝与凤梨的故事,下边即将用菠萝和凤梨,给大家讲述怎么用一个算法来 阅读全文
摘要:
或许很多人认为AI只是那些直接从事AI相关岗位的人必须要掌握的技能,但实际上,不分岗位所有人都需要一种能力,那就是“AI思维”。如果没能在合适的时机把自己的认知提升到一定程度,被替代是很自然的事情。在文本中,我们主要介绍什么是AI思维以及它的重要性。我相信这篇文章会对很多人带来不同程度的启发。 什么 阅读全文
摘要:
我开始以为矩阵是为了把线性方程组的系数抽取出来,方便方程组化简和求解,后来发现矩阵的用处不止如此,不然就不会写一本书了。 矩阵可以方便的用来表示线性空间,一个简单的二维数阵,就可以表示成n维线性空间。 一个毫无意义的有序数阵,我们赋予它意义,他就可以表示成一个空间。那为什么要这么做呢?这是因为矩阵的 阅读全文
摘要:
通俗地讲,求极限的本质是分子与分母“比阶”,比谁的速度快。 就像分子分母在跑道上进行趋于0或者无穷的赛跑,我们旁观者想搞清楚他们1.谁赢了?(极限是大于一还是小于一?)2.他们是差不多同时撞线还是领先者领先好几个身位到达终点?(同阶还是高阶?)同时撞线差了多少?(同阶的话极限到底是几?) 但问题在于 阅读全文
摘要:
阅读目录 1. SimHash与传统hash函数的区别 2. SimHash算法思想 3. SimHash流程实现 4. SimHash签名距离计算 5. SimHash存储和索引 6. SimHash存储和索引 7. 参考内容 在之前的两篇博文分别介绍了常用的hash方法([Data Struct 阅读全文
摘要:
主成分分析(Principal components analysis)-最大方差解释 在这一篇之前的内容是《Factor Analysis》,由于非常理论,打算学完整个课程后再写。在写这篇之前,我阅读了PCA、SVD和LDA。这几个模型相近,却都有自己的特点。本篇打算先介绍PCA,至于他们之间的关 阅读全文
摘要:
主要内容: 通过JavaAPI和Shell命令两种方式操作ES集群 集群环境: 两个 1,未配置集群名称的单节点(模拟学习测试环境); 2,两个节点的集群(模拟正常生产环境). JDK8+ElasticSearch5.1.2(大版本一致即可) Shell命令: 首先存入一条数据 1 curl -X 阅读全文
摘要:
异常1: can not run elasticsearch as root 异常1解决方式: 在es-linux环境中,不允许使用root用户运行ElasticSearch,所以添加一个新的普通用户就可以了(linux命令如下) 异常2: failed to obtain lock on ... 阅读全文