2021 年 4月随笔档案 - jasonzhangxianrong

tensorflow(三十四)：技巧——提前停止和Droupout

摘要：一、提前停止 ▪ Validation set to select parameters ▪ Monitor validation performance ▪ Stop at the highest val perf. 二、DroupOut 注意：在训练时，要加上Training=True，其他都是阅读全文

posted @ 2021-04-29 21:50 jasonzhangxianrong 阅读(793) 评论(0) 推荐(0) 编辑

tensorflow(三十三)：技巧——动量，让学习率逐渐减小

摘要：一、动量 1、普通梯度更新与加上动量的梯度更新。解释：原先更新的方向是梯度方向，现在多了一个Z方向，即现在是结合了历史惯性。二、学习率缓慢减少解释：学习率太大和太小都不太好阅读全文

posted @ 2021-04-29 21:23 jasonzhangxianrong 阅读(220) 评论(0) 推荐(0) 编辑

tensorflow(三十二)：解决过拟合——加惩罚项（让W接近0）

摘要：一、减少过拟合奥卡姆剃刀原理：没必要的东西尽量少用。因此过拟合有以下几种：（1）更多数据（2）限制网络复杂性：使用浅层网络、新数据集使用大网络后加惩罚。（3）droupout （4）数据增强（5）用验证数据早停。二、损失函数加惩罚 1、原始 2、加惩罚项以后三、加惩罚项方法 1、ke 阅读全文

posted @ 2021-04-29 20:46 jasonzhangxianrong 阅读(657) 评论(0) 推荐(0) 编辑

(六)知识蒸馏

摘要：1. 介绍 1.1. 论文提出的背景虽然在一般情况下，我们不会去区分训练和部署使用的模型，但是训练和部署之间存在着一定的不一致性: 在训练过程中，我们需要使用复杂的模型，大量的计算资源，以便从非常大、高度冗余的数据集中提取出信息。在实验中，效果最好的模型往往规模很大，甚至由多个模型集成得到。而大模阅读全文

posted @ 2021-04-28 15:53 jasonzhangxianrong 阅读(756) 评论(0) 推荐(0) 编辑

tensorflow(三十一)：数据分割与K折交叉验证

摘要：一、数据集分割 1、训练集、测试集 2、训练集、验证集、测试集步骤：（1）把训练集60K分成两部分，一部分50K，另一部分10K。（2）组合成dataset，并打乱。二、训练过程评估 1、训练的过程评估其中，第二行是训练，总轮数是5，每两轮做一次评估，达到的效果好的话提前停止。 2、在测试阅读全文

posted @ 2021-04-27 20:40 jasonzhangxianrong 阅读(3391) 评论(0) 推荐(1) 编辑

NLP（十）：pytorch实现中文文本分类

摘要：一、前言参考：https://zhuanlan.zhihu.com/p/73176084 代码：https://link.zhihu.com/?target=https%3A//github.com/649453932/Chinese-Text-Classification-Pytorch 代码：阅读全文

posted @ 2021-04-27 13:49 jasonzhangxianrong 阅读(2435) 评论(0) 推荐(0) 编辑

NLP（九）：pytorch用transformer库实现BERT

摘要：一、资源（1）预训练模型权重链接: https://pan.baidu.com/s/10BCm_qOlajUU3YyFDdLVBQ 密码: 1upi （2）数据集选择的THUCNews，自行下载并整理出10w条数据，内容是10类新闻文本标题的中文分类问题（10分类），每类新闻标题数据量相等，为1 阅读全文

posted @ 2021-04-27 13:15 jasonzhangxianrong 阅读(3447) 评论(0) 推荐(1) 编辑

(三)任务型对话系统简介

摘要：1，概述任务型对话系统越来越多的被应用到实际的场景中，例如siri，阿里小密这类的产品。通常任务型对话系统都是基于pipline的方式实现的，具体的流程图如下：整个pipline由五个模块组成：语音识别；自然语言理解；对话管理；自然语言生成；语音合成。现在越来越多的产品还融入了知识库，主要是在对阅读全文

posted @ 2021-04-25 15:40 jasonzhangxianrong 阅读(1545) 评论(0) 推荐(0) 编辑

python（五）：argparse 模块

摘要：一、传入一个参数我们先在桌面新建“arg学习”的文件夹，在该文件夹中新建demo.py文件，来看一个最简单的argsparse库的使用的例子。 import argparse parser = argparse.ArgumentParser(description='命令行中传入一个数字') #t 阅读全文

posted @ 2021-04-23 16:38 jasonzhangxianrong 阅读(119) 评论(0) 推荐(0) 编辑

tensorflow(三十)：keras自定义网络实战

摘要：一、代码 import tensorflow as tf from tensorflow.python.keras import datasets, layers, optimizers, Sequential, metrics from tensorflow.python import keras 阅读全文

posted @ 2021-04-22 22:18 jasonzhangxianrong 阅读(328) 评论(0) 推荐(0) 编辑

tensorflow(二十九)：模型的保存

摘要：一、第一种：只保存权值 import tensorflow as tf from tensorflow.python.keras import datasets, layers, optimizers, Sequential, metrics import os os.environ['TF_CPP 阅读全文

posted @ 2021-04-22 21:39 jasonzhangxianrong 阅读(180) 评论(0) 推荐(0) 编辑

tensorflow(二十八)：Keras自定义层，继承layer,model

摘要：一、讲解二、代码 import tensorflow as tf from tensorflow.python.keras import datasets, layers, optimizers, Sequential, metrics from tensorflow.python import 阅读全文

posted @ 2021-04-22 21:19 jasonzhangxianrong 阅读(718) 评论(0) 推荐(0) 编辑

tensorflow(二十七)：Keras一句话训练fit

摘要：一、简介不用keras时候：二、用keras简写训练过程现在的写法，首先指定下面的compile以后，直接在下面fit一下，然后这个epoch就是指定上涨图片中的sclice中的10，就是10次epoch,每次traning的loss是按照下面的traing计算，得到一个gradient以后，阅读全文

posted @ 2021-04-22 20:39 jasonzhangxianrong 阅读(585) 评论(0) 推荐(0) 编辑

tensorflow(二十六)：Keras计算准确率和损失

摘要：一、Keras五大功能二、评估指标用法有一个现成的准确度的meter就是 m e t r i c s . A c c u r a c y ( ) metrics.Accuracy()metrics.Accuracy()。如果只是简单的求一个平均值的话，有一个更加通用的meter就是 m e t 阅读全文

posted @ 2021-04-22 20:01 jasonzhangxianrong 阅读(1799) 评论(0) 推荐(0) 编辑

tensorflow(二十五)：Tensorboard可视化

摘要：一、概况其中visdom显示界面可以看出更加的丰富，可以画各种各样的图像。二、安装与工作原理 pip install tensorboard cpu运行一个程序，有一个tensor在这里流动；它会磁盘的某一个目录写数据；比如写在目录logs，写在这个目录下面以后，这个目录对应的文件格式就会被更新阅读全文

posted @ 2021-04-22 18:12 jasonzhangxianrong 阅读(182) 评论(0) 推荐(0) 编辑

python（三）：collection模块

摘要：collections collections是日常工作中的重点、高频模块，常用类型有：计数器（Counter）双向队列（deque）默认字典（defaultdict）有序字典（OrderedDict）可命名元组（namedtuple） 1. Counter Counter作为字典dici 阅读全文

posted @ 2021-04-22 16:47 jasonzhangxianrong 阅读(734) 评论(0) 推荐(0) 编辑

python（二）：configparse模块

摘要：一、ConfigParser简介 ConfigParser 是用来读取配置文件的包。配置文件的格式如下：中括号“[ ]”内包含的为section。section 下面为类似于key-value 的配置内容。 [db] db_host = 127.0.0.1 db_port = 69 db_user 阅读全文

posted @ 2021-04-22 16:45 jasonzhangxianrong 阅读(149) 评论(0) 推荐(0) 编辑

推荐系统（二）：基于pytorch的textdeepfm

摘要：一、main函数 import torch import tqdm from sklearn.metrics import roc_auc_score from torch.utils.data import DataLoader from torchfm.dataset.avazu import 阅读全文

posted @ 2021-04-22 15:18 jasonzhangxianrong 阅读(490) 评论(0) 推荐(0) 编辑

NLP（七）：textCNN

摘要：一、代码 import torch.optim as optim import torch.utils.data as Data import torch.nn.functional as F from model.word_2_vector import WordEmbedding import 阅读全文

posted @ 2021-04-20 18:13 jasonzhangxianrong 阅读(146) 评论(0) 推荐(0) 编辑

NLP（六）：BiLSTM_Attention实现

摘要：BiLSTM_Attention实现阅读全文

posted @ 2021-04-20 09:38 jasonzhangxianrong 阅读(691) 评论(0) 推荐(0) 编辑

NLP（五）：BiGRU_Attention的pytorch实现

摘要：一、预备知识 1、nn.Embedding 在pytorch里面实现word embedding是通过一个函数来实现的:nn.Embedding. # -*- coding: utf-8 -*- import numpy as np import torch import torch.nn as n 阅读全文

posted @ 2021-04-19 09:31 jasonzhangxianrong 阅读(1745) 评论(0) 推荐(0) 编辑

(二) PCA的数学原理

摘要：PCA（Principal Component Analysis）是一种常用的数据分析方法。PCA通过线性变换将原始数据变换为一组各维度线性无关的表示，可用于提取数据的主要特征分量，常用于高维数据的降维。网上关于PCA的文章有很多，但是大多数只描述了PCA的分析过程，而没有讲述其中的原理。这篇文章的阅读全文

posted @ 2021-04-12 20:27 jasonzhangxianrong 阅读(132) 评论(0) 推荐(0) 编辑

(一) 用户画像的聚类

摘要：聚类（Clustering），顾名思义就是“物以类聚，人以群分”，其主要思想是按照特定标准把数据集聚合成不同的簇，使同一簇内的数据对象的相似性尽可能大，同时，使不在同一簇内的数据对象的差异性尽可能大。通俗地说，就是把相似的对象分到同一组。聚类算法通常不使用训练数据，只要计算对象间的相似度即可应用算阅读全文

posted @ 2021-04-12 14:31 jasonzhangxianrong 阅读(963) 评论(0) 推荐(0) 编辑

pandas(一)：选取部分（行、列）写入到另一个文件

摘要：一、选取列 import pandas as pd df = pd.read_csv('zhihutest.csv', sep="\t") # 类别特征(16) fixlen_category_columns = ['m_sex', 'm_access_frequencies', 'm_twoA', 阅读全文

posted @ 2021-04-09 15:10 jasonzhangxianrong 阅读(2000) 评论(0) 推荐(0) 编辑

tensorflow(二十四)：fashion mnist数据集，训练与测试

摘要：一、代码 import tensorflow as tf from tensorflow import keras from tensorflow.keras import datasets, layers, optimizers, Sequential, metrics import os os. 阅读全文

posted @ 2021-04-07 20:44 jasonzhangxianrong 阅读(384) 评论(0) 推荐(0) 编辑

tensorflow(二十三)：函数优化

摘要：一、函数绘图代码 import tensorflow as tf import numpy as np from mpl_toolkits.mplot3d import Axes3D import matplotlib.pyplot as plt import os os.environ['TF_ 阅读全文

posted @ 2021-04-07 20:32 jasonzhangxianrong 阅读(137) 评论(0) 推荐(0) 编辑

tensorflow(二十二)：梯度下降，求解梯度

摘要：求梯度阅读全文

posted @ 2021-04-07 20:14 jasonzhangxianrong 阅读(350) 评论(0) 推荐(0) 编辑

tensorflow(二十一)：误差计算方法（MSE和交叉熵）

摘要：tensorflow(二十一)：误差计算方法（MSE和交叉熵）阅读全文

posted @ 2021-04-02 22:02 jasonzhangxianrong 阅读(785) 评论(0) 推荐(0) 编辑

tensorflow(二十)：输出、损失函数

摘要：tensorflow(二十)：输出、损失函数阅读全文

posted @ 2021-04-02 20:54 jasonzhangxianrong 阅读(428) 评论(0) 推荐(0) 编辑

tensorflow(十九)：全连接层

摘要：tensorflow(十九)：全连接层阅读全文

posted @ 2021-04-02 20:34 jasonzhangxianrong 阅读(268) 评论(0) 推荐(0) 编辑

tensorflow(十八)：神经网络验证测试

摘要：一、测试 import tensorflow as tf from tensorflow import keras from tensorflow.keras import datasets import os os.environ['TF_CPP_MIN_LOG_LEVEL'] = '2' # x 阅读全文

posted @ 2021-04-02 20:20 jasonzhangxianrong 阅读(247) 评论(0) 推荐(0) 编辑

tensorflow(十七)：数据的加载：map()、shuffle()、tf.data.Dataset.from_tensor_slices()

摘要：tensorflow(十七)：数据的加载阅读全文

posted @ 2021-04-02 20:16 jasonzhangxianrong 阅读(1308) 评论(0) 推荐(1) 编辑

tensorflow(十七)：高阶操作：tf.where()，tf.scatter_nd()， tf.meshgrid()

摘要：tensorflow(十七)：高阶操作：tf.where()，tf.scatter_nd()， tf.meshgrid() 阅读全文

posted @ 2021-04-02 19:52 jasonzhangxianrong 阅读(275) 评论(0) 推荐(0) 编辑

tensorflow(十六)：张量的限幅（tf.clip_by_value()、 tf.clip_by_norm()、 tf.clip_by_global_norm()）

摘要：tensorflow(十六)：张量的限幅（tf.clip_by_value()、 tf.clip_by_norm()、 tf.clip_by_global_norm()）阅读全文

posted @ 2021-04-02 19:18 jasonzhangxianrong 阅读(583) 评论(0) 推荐(0) 编辑

tensorflow(十五)：填充与复制（pad、 tile、 broadcast_to）

摘要：tensorflow(十五)：填充与复制（pad、 tile、 broadcast_to）阅读全文