随笔分类 - 算法
摘要:在将深度学习模型用于分类任务时,我们通常会遇到以下问题:过度拟合和过度自信。对过度拟合的研究非常深入,可以通过早期停止, 辍学,体重调整等方法解决。另一方面,我们缺乏解决过度自信的工具。标签平滑 是解决这两个问题的正则化技术。通过对 label 进行 weighted sum,能够取得比 one h
阅读全文
摘要:笔记: 研究问题: 文本生成评测指标 人工评估昂贵而缓慢 自动指标对词汇变化敏感不能理解语义或者语法变化 ROUGE and BLEU:最早出现的句子相似度度量方法,基于N-gram重叠。这些度量标准只对词汇变化敏感,不能识别句子语义或语法的变化。因此,它们被反复证明与人工评估差距较大。 BEER,
阅读全文
摘要:使用python-Statsmodels进行基于统计学的时间序列分析 StatsModels简介 statistic in python 提供用于估计许多不同的统计模型以及进行统计测试和统计数据探索的类和函数。每个估算器都有大量的结果统计信息列表。 基本的功能列表如下 线性回归模型 绘图 离散选择模
阅读全文
摘要:鉴于单峰的状态分布公式是: f(x)=(1/((2π)^0.5)*σ)exp-((x-a)^2/(2*σ^2)) 于是N个平均值。标准差值不同的正态分布公式应当是 f(x)= ∑(ki/((2π)^0.5)*σi)exp-((x-ai)^2/(2*σi^2)) 以上求和是针对i的。这里每个i对应一个
阅读全文
摘要:代码解析 初始化 一些初始化代码,载入必要的包,保证图像输出在网页中而不新建窗口。 载入数据 载入CIFAR-10数据。输出数据格式: 由于是彩图3通道,故大小为32*32*3. 展示部分训练图 从每一类中展示7张训练图片。结果如下: 取样数据 在练习中,为了更高效地执行代码,我们只取样部分数据。选
阅读全文