摘要:
题目介绍 题目链接 https://pintia.cn/problem-sets/994805342720868352/problems/994805493648703488 题目考点 map、排序、模拟。map是简单地用了一下,排序也不难,重在模拟。 题目难度 PAT甲级25分 题目大意 长途电话 阅读全文
摘要:
题目介绍 题目链接 https://pintia.cn/problem-sets/994805342720868352/problems/994805502658068480 题目考点 排序、模拟,重点在模拟而非排序 题目难度 PAT甲级25分 题目大意 给出多个学生的C语言(C)、数学(M)、英语 阅读全文
摘要:
题目介绍 题目链接 https://pintia.cn/problem-sets/994805342720868352/problems/994805419468242944 题目考点 队列、模拟。重点在模拟,队列只用到了建立、入队、出队、清空(需要自己实现,创建新的队列然后赋值或者swap)。 题 阅读全文
摘要:
链式法则(Chain Rule) \(z=h(y),y=g(x)\to\frac{dz}{dx}=\frac{dz}{dy}\frac{dy}{dx}\) \(z=k(x,y),x=g(s),y=h(s)\to\frac{dz}{ds}=\frac{dz}{dx}\frac{dx}{ds}+\fra 阅读全文
摘要:
为什么是“深度”神经网络? 问题与答案 矮胖的神经网络和高瘦的神经网络,假设它们参数量相同,哪一个更好呢? 2011年有一个实验,证明在参数量相当的情况下,高瘦的神经网络(即深度神经网络)的准确度更高,因为深度可以实现模块化。 只用一个神经元足够多的隐藏层,这个模型就包括了任意函数,那为什么不这么做 阅读全文
摘要:
题目介绍 题目链接 https://pintia.cn/problem-sets/994805342720868352/problems/994805498207911936 题目考点 队列和模拟,重难点在于模拟而非队列 题目难度 PAT甲级30分 题目大意 有N个窗口,每个窗口最多允许M个人站在黄 阅读全文
摘要:
引言 poplib是一个python第三方库,基于它我们可以连接POP3服务器。 email是一个python内置的模块,基于它我们可以管理邮箱中的邮件。 Some Story 我现在需要下载很多邮件的附件。我之前有一份相同功能的代码(点击这里),发布出来之后博客访问量也挺高。然而,当时由于时间原因 阅读全文
摘要:
深度学习的历史 1958年:心理学家Rosenblatt提出感知机(Perceptron) 它是一个线性模型。 1969年:有人说感知机是线性模型,具有局限性。 1980年代:多层感知机(Multi-layer Perceptron) 和当今的神经网络是没有本质差别的。 1986年:Hinton提出 阅读全文
摘要:
逻辑回归 假设训练集如下,有2个类别$C_1$和$C_2$,表格中的每列为一个样本。 例如,第一列表示样本$x1$的类别为$C_1$,所以它的标签$\hat y1$是1。 \(x^1\) \(x^2\) \(x^2\) \(\dots\) \(x^N\) \(C_1\) \(C_1\) \(C_2\ 阅读全文
摘要:
贝叶斯公式 \(P(A\cap B)=P(A)P(B|A)=P(B)P(A|B)\) \(P(A|B)=\frac{P(B|A)P(A)}{P(B)}\) 全概率公式 \(P(B)=\sum_{i=1}^nP(A_i)P(B|A_i)\) 概率生成模型(Probalitity Generative 阅读全文
摘要:
分类模型应用案例(Classification Cases) 信用评分(Credit Scoring) 输入:收入、储蓄、职业、年龄、信用历史等等 输出:是否贷款 医疗诊断(Medical Diagnosis) 输入:现在症状、年龄、性别、病史 输出:哪种疾病 手写文字识别(Handwritten 阅读全文
摘要:
梯度下降伪代码 梯度下降可以优化损失函数的值,使其尽量小,即可找到最好(在数据集上拟合效果最好)的模型参数。 现在假设模型$f$中只有一个参数$w$,则损失函数为$L(f)=L(w)$,梯度下降算法如下(若模型有多个参数,按相同方法更新各参数) 初始化参数 随机选取一个$w0$($w0$并不一定是随 阅读全文
摘要:
本文为作者学习李宏毅机器学习课程时参照样例完成homework1的记录。 关注我的公众号:臭咸鱼,回复LHY可获取课程PPT、数据、笔记和代码下载链接。 代码仓库:chouxianyu/LHY_ML2020_Codes,里面除了代码还有数据、PPT、笔记等资源喔~ 任务描述(Task Descrip 阅读全文
摘要:
交叉验证(Cross Validation) 在机器学习中,通常不能将全部数据用于模型训练,否则将没有数据集可以用来评估模型。 The Validation Set Approach 定义 将数据集划分成训练集(Training Set)和测试集(Test Set)两部分。 缺点 这种方法的缺点是依 阅读全文
摘要:
欠拟合(Underfitting) 定义 Bias较大、Variance较小。 如果模型在训练集上的误差很大,则此时Bias是大的,情况为欠拟合。 Bias大时如何处理 使用更复杂的模型,比如添加考虑更多维度的输入、把线性模型换成非线性模型。 过拟合(Overfitting) 定义 Bias较小、V 阅读全文