01 2020 档案
摘要:本文始发于个人公众号: TechFlow 今天的文章聊聊高等数学当中的 极限 ,我们跳过极限定义以及一些常用极限计算的部分。我想对于一些比较常用的函数以及数列的极限,大家应该都非常熟悉。 大部分比较简单的函数或者数列,我们可以很直观地看出来它们的极限。比如,当n趋向于无穷大
阅读全文
摘要:本文始发于个人公众号: TechFlow 1 这几天春节,因为疫情和拜年,所以文章停更了四天。但是这四天里我并没有偷懒,我利用间歇的时间读了一本久仰大名但是一直没有时间阅读的书。它就是吴军老师的著作——《 数学之美 》。 之前早在我还在上大学的时候,就听线性代数的老师给我们推荐过这本书。但是当时并没
阅读全文
摘要:本文始发于个人公众号: TechFlow 今天这篇文章和大家聊聊 期望和方差 。 期望 期望这个概念我们很早就在课本里接触了,维基百科的定义是: 它表示的是一个随机变量的值在每次实验当中可能出现的结果乘上结果概率的总和 。换句话说,期望值衡量的是多次实验下,所有可能得到的状态的平均结果。 我们举两个
阅读全文
摘要:本文始发于个人公众号: TechFlow 最近看到一道很有意思的问题,分享给大家。 还是老规矩,在我们聊算法问题之前,先来看一个故事。 传说中,有 5个海盗 组成了一支无敌的海盗舰队,他们在最后一次的寻宝当中找寻到了 100枚价值连城 的金币。于是,很自然的,这群海盗面临分赃的问题。为了防止海盗内讧
阅读全文
摘要:本文始发于个人公众号: TechFlow 上一篇文章当中我们介绍了 朴素贝叶斯模型的基本原理 。 朴素贝叶斯的核心本质是假设样本当中的变量 服从某个分布 ,从而利用条件概率计算出样本属于某个类别的概率。一般来说一个样本往往会含有许多特征,这些特征之间很有可能是有相关性的。为了简化模型,朴素贝叶斯模型
阅读全文
摘要:向量内积 这个基本上是中学当中数学课本上的概念,两个向量的 内积 非常简单,我们直接看公式回顾一下: 这里X和Y都是n维的向量,两个向量能够计算内积的前提是两个向量的维度一样。从上面公式可以看出来,两个向量的内积就等于两个向量
阅读全文
摘要:今天这篇文章和大家聊聊朴素贝叶斯模型,这是机器学习领域非常经典的模型之一,而且非常简单,适合初学者入门。 朴素贝叶斯模型,顾名思义和贝叶斯定理肯定高度相关。之前我们在三扇门游戏的文章当中介绍过贝叶斯定理,我们先来简单回顾一下贝叶斯公式: $$P(A|B)=\frac{P(A)P(B|A)}{P(B)
阅读全文
摘要:这一篇文章和大家聊聊 向量 。 向量与平面 向量这个概念我们在高中就接触到了,它既指一个点在空间中的坐标,也表示一个有向线段,如果我们加入复数概念的话,它还能表示一个数。在线性代数当中,向量就是指的n个有次序的数组成的数组。 向量可以写成一行,也可以写成
阅读全文
摘要:题意 The string "PAYPALISHIRING" is written in a zigzag pattern on a given number of rows like this: (you may want to display this pattern in a fixed fo
阅读全文
摘要:题意 翻译 给定一个字符串s,要求它当中的最长回文子串。可以假设s串的长度最大是1000。 样例 分析 虽然LeetCode里给这道题的难度是Medium,但实际上并不简单,我们通过自己思考很难想到最佳解法。 我们先把各种算法放在一边,先从最简单的方法开始。最简单的方法当然是暴力枚举,但是这道题和之
阅读全文
摘要:分布式系统当中有一个著名的CAP理论,它也是分布式系统理论的基础。 CAP理论最早发表于2000年,由加州伯克利的教授首先在ACM PODC会议上提出猜想,两年之后,被麻省理工学院的教授Seth Gilbert和Nancy Lynch从理论上证明。从此之后,它成了分布式系统领域的公认定理。 今天这篇
阅读全文
摘要:从前有一户夫妻,他们生了两个孩子。已知其中一个是女孩,那么另一个孩子也是女孩的概率是多少呢? 这是一道概率论课本上的经典问题,一开始的时候,很多人会觉得两个孩子的性别是独立事件,我们知道其中一个孩子的性别,应该对另一个孩子没有影响。但实际上并不是这样,我们可以列出两个孩子性别的所有可能: 从上面这个
阅读全文
摘要:本文始发于个人公众号: TechFlow 1 在开始今天的文章之前,我们先来讲一个故事: 在一个月黑风高的夜晚,怪盗基德潜入了一个著名的珠宝会馆。他面前有三个装着珠宝的柜子,这三个规则分别是A、B和C。每个柜子里装了一个珠宝,这三个珠宝的体积分别是6,5,5,价值分别是10,5, 6。基德每次只能打
阅读全文
摘要:本文始发于个人公众号:TechFlow 今天的文章,我们继续探讨搜索引擎,和大家聊聊搜索引擎最重要的一环——倒排索引。 在介绍倒排索引之前,我们先来看看什么是索引。索引是数据库当中的概念,维基百科中的说法是“数据库索引,是数据库管理系统中一个排序的数据结构,以协助快速查询、更新数据库表中数据”。可以
阅读全文
摘要:这篇文章和大家聊聊矩阵的初等变换和矩阵的秩。 矩阵的初等变换这个概念可能在很多人听来有些陌生,但其实我们早在初中的解多元方程组的时候就用过它。只不过在课本当中,这种方法叫做消元法。我们先来看一个课本里的例子: 假设我们要解这个方程,怎么做呢? 首先,我们把(1)式加到(2)式,把(4)式加到(3)式
阅读全文
摘要:本文始发于个人公众号: TechFlow 说到数据库,以前我老师有一句很经典的话。你可以不会写SQL,但是一定不能不知道ACID。 在工业领域,SQL可以说是应用最广泛的技术。从后端到算法,从数据到DBA,再到产品,甚至连一些运营也会基本的SQL。所以如果你现在还不太会的话,我建议你用一个下午的时间
阅读全文
摘要:本文首发于公众号:TechFlow 在概率论的课本上有一个经典的问题,一直困扰我很久。有很多次我以为我想明白了,过了一段时间却又会糊涂。这个问题学过概率论的同学想必都知道,就是著名的三扇门问题。 说是之前在美国有一个著名的综艺节目,这个节目里有三扇关闭着的门。其中有两扇的后面是山羊,有一扇则放着一辆
阅读全文
摘要:本文始发于个人公众号: TechFlow 之前的文章当中我们详细阐述了二分法,尤其是讨论了我们在编写代码时候的边界问题。传送门: "算法浅谈——人人皆知却很多人写不对的二分法" 今天这一篇文章,我们继续来讲算法,我们不讲二分法了。来讲讲二分法的进阶版—— 三分法 。 是的,你们没有看错,这不是我任性
阅读全文
摘要:在前文当中,我们介绍了搜索引擎的大致原理。有错过或者不熟悉的同学,可以点击下方的链接回顾一下前文的内容。 "ML基础——搜索引擎基本原理" 在介绍爬虫部分的时候,我们知道,爬虫在爬取到网页的内容之后,会先进行一些处理。首先要做的就是过滤掉HTML当中的各种标签信息,只保留最原生的网页内容。之后,程序
阅读全文