摘要:
本文主要介绍Python 3.10带来的新特性——match语句。 在Python 3.10发布之前,Python是没有类似于其他语言中switch语句的,要实现类似的功能最简单的方法就是通过if ... elif ... else ...语句,但是这样毕竟不够优雅,不够“Pythonic”。 更推 阅读全文
摘要:
异常处理的基础概念 异常处理:对有可能发生的异常的预处理方案。 代码格式: try: 可能发生异常的代码块 except 异常类型: 异常处理的代码块 捕获指定类型的异常 下面这种写法只能捕获except语句后面指定的异常类型: 如果发生其他类型的异常,是无法捕获的,程序依然会崩溃(和没有捕获异常一 阅读全文
摘要:
Topic: Naive Bayes 求最优解 (closed-form) MLE (最大似然) Lagrange Multiplier Method (拉格朗日乘数法) Solve for Naive Bayes 讲解朴素贝叶斯模型的数学原理。 求极值 例题:\(f(x)=x^2-2x-3\) 1 阅读全文
摘要:
Two Main Branches of Learning 学习系统的两个方向: 专家系统:符号主义,基于规则来实现,目前仍然有在使用。适合数据量很少甚至没有的时候。 基于概率统计的系统:连接主义,基于学习的方式来实现,比如机器学习,深度学习。适合拥有大量数据的情况。 虽然目前最火的是基于概率统计的 阅读全文
摘要:
通过leetcode上面的5道基础动态规划题目,讲解求解动态规划问题的思路。 定义 对于动态规划问题,通常需要做3件事情: 问题目标 状态的定义:\(opt[n]\) 状态转移方程:\(opt[n] = best\_of(opt[n-1], opt[n-2], ...)\) 最大子序和 给定一个整数 阅读全文
摘要:
Language Model (语言模型) Noisy Channel Model \[ p(text|source) \propto p(source|text)p(text) \] $\propto$符号表示成正比,公式根据Bayes定理得出,目标是找到使得$p(text|source)$概率最 阅读全文
摘要:
Q&A System Introduction (问答系统介绍) Q:能否根据语料库搭建一个智能客服系统(问答系统)? 基于搜索的问答系统 基于搜索的问答系统的解决思路:根据用户输入问题,从语料库中找到相似度最高的问题,返回相对应的答案作为回答。 简单流程: 基于搜索的问答系统 vs 基于知识图谱的 阅读全文
摘要:
前面我们已经讲解了线性回归和逻辑回归算法,但是当我们将这些算法应用到实际问题中时,有可能会出现过拟合问题(overfitting problem),导致效果很差,我们可以通过正则化来处理过拟合问题。 The Problem of Overfitting 主要介绍了什么是过拟合。 Example 以我 阅读全文
摘要:
本章主要通过一个应用实例——图片文字识别(Photo OCR),来讲解一个完整的机器学习问题中的相关概念。 Problem description and pipeline 本节主要讲解了什么是OCR,以及机器学习中流水线/管道(pipeline)的概念。 The Photo OCR problem 阅读全文
摘要:
本章主要讲解如何将大规模数据集运用到机器学习算法。 Learning with large datasets 从上面这幅图我们可以知道,数据集的规模往往比算法更重要,也就是说采用大数据量训练普通算法,效果也会比只拥有少量数据的优秀算法更好。 而大数据应用在机器学习算法上面最常见的问题就是运算量的问题 阅读全文