摘要:
一、减少过拟合 奥卡姆剃刀原理:没必要的东西尽量少用。 因此过拟合有以下几种: (1)更多数据 (2)限制网络复杂性:使用浅层网络、新数据集使用大网络后加惩罚。 (3)droupout (4)数据增强 (5)用验证数据早停。 二、损失函数加惩罚 1、原始 2、加惩罚项以后 三、加惩罚项方法 1、ke 阅读全文
摘要:
1. 介绍 1.1. 论文提出的背景 虽然在一般情况下,我们不会去区分训练和部署使用的模型,但是训练和部署之间存在着一定的不一致性: 在训练过程中,我们需要使用复杂的模型,大量的计算资源,以便从非常大、高度冗余的数据集中提取出信息。在实验中,效果最好的模型往往规模很大,甚至由多个模型集成得到。而大模 阅读全文
摘要:
一、数据集分割 1、训练集、测试集 2、训练集、验证集、测试集 步骤: (1)把训练集60K分成两部分,一部分50K,另一部分10K。 (2)组合成dataset,并打乱。 二、训练过程评估 1、训练的过程评估 其中,第二行是训练,总轮数是5,每两轮做一次评估,达到的效果好的话提前停止。 2、在测试 阅读全文
摘要:
一、前言 参考:https://zhuanlan.zhihu.com/p/73176084 代码:https://link.zhihu.com/?target=https%3A//github.com/649453932/Chinese-Text-Classification-Pytorch 代码: 阅读全文
摘要:
一、资源 (1)预训练模型权重 链接: https://pan.baidu.com/s/10BCm_qOlajUU3YyFDdLVBQ 密码: 1upi (2)数据集选择的THUCNews,自行下载并整理出10w条数据,内容是10类新闻文本标题的中文分类问题(10分类),每类新闻标题数据量相等,为1 阅读全文
摘要:
1,概述 任务型对话系统越来越多的被应用到实际的场景中,例如siri,阿里小密这类的产品。通常任务型对话系统都是基于pipline的方式实现的,具体的流程图如下: 整个pipline由五个模块组成:语音识别;自然语言理解;对话管理;自然语言生成;语音合成。现在越来越多的产品还融入了知识库,主要是在对 阅读全文
摘要:
一、传入一个参数 我们先在桌面新建“arg学习”的文件夹,在该文件夹中新建demo.py文件,来看一个最简单的argsparse库的使用的例子。 import argparse parser = argparse.ArgumentParser(description='命令行中传入一个数字') #t 阅读全文
摘要:
一、代码 import tensorflow as tf from tensorflow.python.keras import datasets, layers, optimizers, Sequential, metrics from tensorflow.python import keras 阅读全文
摘要:
一、第一种:只保存权值 import tensorflow as tf from tensorflow.python.keras import datasets, layers, optimizers, Sequential, metrics import os os.environ['TF_CPP 阅读全文
摘要:
一、讲解 二、代码 import tensorflow as tf from tensorflow.python.keras import datasets, layers, optimizers, Sequential, metrics from tensorflow.python import 阅读全文