Deep Learning - 随笔分类(第3页) - 今夜无风

Adversarial Training Methods For Semi-Supervised Text Classification 虚拟对抗训练思路指引

摘要：模型搞到这时候，就是要以不断提升泛化力和鲁棒性，当今两个主流的方法是（1）知识蒸馏；（2）对抗学习本节主要说对抗训练，它是一种能够有效提高模型鲁棒性和泛化能力的训练手段，基本原理：在原始输入上增加对抗扰动，得到对抗样本，再利用对抗样本进行训练，从而提高模型表现。在自然语言处理中，这个任务处理的就阅读全文

posted @ 2020-03-03 17:17 今夜无风阅读(1209) 评论(0) 推荐(0) 编辑

英伟达Transfer Learning Toolkit 1.0 产品介绍、演示及技术交流

摘要：阅读全文

posted @ 2020-03-03 12:15 今夜无风阅读(398) 评论(0) 推荐(0) 编辑

MNIST 数据加载

摘要：import numpy as np from matplotlib import pyplot as plt from torchvision import datasets, transforms def softmax_t(x, t): x_exp = np.exp(x /t) return 阅读全文

posted @ 2020-03-02 12:21 今夜无风阅读(433) 评论(0) 推荐(0) 编辑

深度学习模型压缩-知识蒸馏工程实践

摘要：学生模型以较少的参数学习老师的分布，在老师的知道下获得性能提升，可以作为模型压缩的一种思路，示例代码如下： """ Function：knowledge distillation """ import math import torch import torch.nn as nn import to 阅读全文

posted @ 2020-02-29 17:23 今夜无风阅读(1265) 评论(6) 推荐(1) 编辑

深度学习模型-快速构建词典和id的映射

摘要：直接上代码 from collections import Counter import numpy as np text = 'I love china. the dog on the ground' text = text.split() # print(text) vocab = dict(C 阅读全文

posted @ 2020-02-26 16:02 今夜无风阅读(645) 评论(0) 推荐(0) 编辑

pytroch 掌握深度模型构建精髓

摘要：pytorch几十行代码搞清楚模型的构建和训练 import torch import torch.nn as nn N, D_in, H, D_out = 64, 1000, 100, 10 # data x = torch.randn(N, D_in) y = torch.randn(N, D_ 阅读全文

posted @ 2020-02-23 20:45 今夜无风阅读(166) 评论(0) 推荐(0) 编辑

2020年中文NLP顶级预训练模块

摘要：对于BERT后时代，不得不说强有力的预训练模型是刷榜、出色完成任务的基础，现在列举几个对此很有帮助的资源，同大家一起进步！！！一：互联网新闻情感分析复赛top8(8/2745)解决方案及总结；地址：https://zhuanlan.zhihu.com/p/101554661 大佬的这篇知乎博客总阅读全文

posted @ 2020-02-21 16:55 今夜无风阅读(1098) 评论(0) 推荐(0) 编辑

基于BERT的多模型融合借鉴

摘要：本次介绍假新闻赛道一第一名的构建思路，大家一起学习下任务描述文本是新闻信息的主要载体，对新闻文本的研究有助于虚假新闻的有效识别。虚假新闻文本检测，具体任务为：给定一个新闻事件的文本，判定该事件属于真实新闻还是虚假新闻。该任务可抽象为NLP领域的文本分类任务，根据新闻文本内容，判定该新闻是真新闻还阅读全文

posted @ 2020-02-16 20:10 今夜无风阅读(4663) 评论(0) 推荐(0) 编辑

多模态智能信息检索技术设计及分类模型设计

摘要：一、多模态智能信息检索技术设计1.设计检索的框架流程，设计检索评估方法完成的任务：用户搜索“苹果”，在限定性语境中，如何做到用户是需要找“苹果手机”，而不是水果“苹果”系统输入：一个关键词输出：同输入词相关的若干词汇（可能是用户需要的敏感词汇）预计出现的问题： 1）输出相似或相关词汇由于模型的误判阅读全文

posted @ 2020-02-14 17:27 今夜无风阅读(1032) 评论(0) 推荐(1) 编辑

反欺诈系统设计过程中的对策与思考

摘要：1.现状 1）为啥诈骗检测的难度高：诈骗的定义很模糊，很多情况下客户都根本不知道具体的诈骗表面上诈骗是一个二分类问题（是或者不是），但仔细想想是一个多分类问题，因为每种不同的诈骗都可以当成一个单独的类型单一类型的诈骗非常之多，普遍存在，同时诈骗的手段也在千变万化。需要不断更新检测手段，不能把赌阅读全文

posted @ 2020-02-13 10:09 今夜无风阅读(598) 评论(0) 推荐(0) 编辑

几个关键性认知名词

摘要：多任务学习、对抗学习、知识蒸馏三大方法结合起来，效果突飞猛进？？？ NLP新基准SuperGLUE榜单刷新追一科技超Facebook，地址：https://m.gmw.cn/baijia/2020-01/20/33497522.html 那么结合的方式值得我们思考讨论阅读全文

posted @ 2020-01-21 09:27 今夜无风阅读(146) 评论(0) 推荐(0) 编辑

预训练模型知识收集-持续更新

摘要：预训练文本分类地址： https://www.cnblogs.com/jiangxinyang/p/10241243.html https://www.cnblogs.com/zhouxiaosong/p/11384197.html 快速适配下游任务的工程代码：https://github.com/ 阅读全文

posted @ 2020-01-16 20:58 今夜无风阅读(221) 评论(0) 推荐(0) 编辑

2020年NLP领域展望与规划

摘要：新年伊始，NLP技术在2019年大放异彩，BERT，GPT-2，Mass，ElMo，ULMFit等预训练+精调的思维路线开辟了新的方向，也给我们这一块带来新的希望！作为工程技术人员，我们首要就是要将更好的技术应用于产品，获取利润，那么可以在大佬的步伐下吃一波红利，指导应用开发。本人也比较懒，总结做阅读全文

posted @ 2020-01-16 15:25 今夜无风阅读(1410) 评论(0) 推荐(0) 编辑

文本摘要生成方法

摘要：最近在搞聊天数据分析，对文本摘要有需求，学习一下该方法。一、文本摘要(Document Summarization) 文本摘要，一般地我们会把它分成抽取式文本摘要和生成式文本摘要。就目前的形势而言，工业界应用广泛的还是抽取式文本摘要。抽取式文本摘要的优点很多，主题不易偏离、适应性广、速度快。抽取阅读全文

posted @ 2019-12-04 17:36 今夜无风阅读(4896) 评论(0) 推荐(0) 编辑

从语料中找出低频词-去除无用信息

摘要：1.做文本聚类时，有些低频词是分词错误或者无用信息，前期需要处理掉关键代码：阅读全文

posted @ 2019-11-26 09:56 今夜无风阅读(1146) 评论(0) 推荐(0) 编辑

模型区分度衡量指标-KS值

摘要：1.KS值--学习器将正例和反例分开的能力，确定最好的“截断点” KS曲线和ROC曲线都用到了TPR，FPR。KS曲线是把TPR和FPR都作为纵坐标，而样本数作为横坐标。但是AUC只评价了模型的整体训练效果，并没有指出如何划分类别让预估的效果达到最好。不同之处在于，ks取的是TPR和FPR差值的最大阅读全文

posted @ 2019-09-25 10:04 今夜无风阅读(8340) 评论(0) 推荐(0) 编辑

模型组合的几个思路

摘要：阅读全文

posted @ 2019-09-18 17:40 今夜无风阅读(220) 评论(0) 推荐(0) 编辑

百度AI文本审核API使用说明

摘要：虽然，虽然，虽然，今天：百度发布了2019年第一季度未经审计的财务报告。本季度百度营收241亿元人民币（约合35.9亿美元），同比增长15%，移除业务拆分收入影响，同比增长21%。低于市场预期242.7亿元。净亏损为人民币3.27亿元（约合4900万美元），去年同期净利润为人民币66.94亿元。这阅读全文

posted @ 2019-05-18 14:16 今夜无风阅读(3722) 评论(0) 推荐(0) 编辑

使用清华源进行pip install

摘要：pypi 镜像使用帮助 pypi 镜像每 5 分钟同步一次。临时使用 pip install -i https://pypi.tuna.tsinghua.edu.cn/simple some-package 注意，simple 不能少, 是 https 而不是 http 设为默认升级 pip 到阅读全文

posted @ 2019-05-05 17:28 今夜无风阅读(1598) 评论(0) 推荐(0) 编辑

BERT和ULMFIT embedding比较文本分类结果

摘要：Instructions [THIS REPOSITORY IS UNDER DEVELOPMENT AND MOER DATASETS AND MODELS WILL BE ADDED] [FEEL FREE TO MAKE PULL REQUEST FOR A NEW DATASET OR NE 阅读全文

posted @ 2019-04-30 17:43 今夜无风阅读(538) 评论(0) 推荐(0) 编辑

随笔分类 - Deep Learning

公告

搜索

常用链接

我的标签

随笔分类

随笔档案

阅读排行榜

评论排行榜

推荐排行榜

最新评论