随笔 - 383
文章 - 0
评论 - 0
阅读 -
35125
03 2020 档案
论文检索
摘要:科学文献数据库:http://arxiv.org 查找arxiv上论文的工具:http://www.arxiv-sanity.com/, 可查找关键字相关的论文,并按时间远近排序,列表中也显示了introduce。 show similar可查找与之类似的论...
阅读全文
实战文本分类对抗攻击
摘要:文章写得比较长,先列出大纲,以便读者直取重点。 “文本分类对抗攻击”是清华大学和阿里安全2020年2月举办的一场AI比赛,从开榜到比赛结束20天左右,内容是主办方在线提供1000条辱骂样本,参赛者用算法逐条扰动,使线上模型将其判别为非辱骂样本,尽量让扰动较小...
阅读全文
Fasttext快速文本分类
摘要:Fasttext源于2016年的论文《Bag of Tricks for Efficient Text Classification》,论文地址:https://arxiv.org/pdf/1607.01759.pdf。论文非常短,加上References不过...
阅读全文
强化学习(一)基本概念和工具
摘要:引入 强化学习是与人类的学习最为相似的一种算法,它根据现有的经验和当前的环境做出预判,然后选择下一步的目标和行动。 强化学习、有监督学习、无监督学习,有着不同的方法和不同的使用场景。有监督学习适合解决具体而确定的,已知答案的问题,比如分类问题;无监督学习用于从...
阅读全文
轻量级BERT模型ALBERT
摘要:BERT有很多改进版本,ALBERT是一个轻量化版本。ALBERT源自2020年的发表论文《ALBERT: A LITE BERT FOR SELF-SUPERVISED LEARNING OF LANGUAGE REPRESENTATIONS》,论文地址:h...
阅读全文
少儿Python编程_第十七讲:互联网和Web服务
摘要:现在人们每天都在使用网络,交通、住宿、购物、外出吃饭大多数都用手机操作,甚至很多人出门都不带钱包。如果家里断网,或者手机断网,那么用微信、看新闻、看视频、网购、手机支付都将无法使用。 网络到底是什么?每一台手机、电脑、以及远程的服务又是如何连接?如何传输数据?...
阅读全文
序列对抗网络SeqGAN
摘要:SeqGAN源自2016年的论文《SeqGAN: Sequence Generative Adversarial Nets with Policy Gradient》,论文地址:https://arxiv.org/pdf/1609.05473.pdf。其核心是...
阅读全文
梯度攻击
摘要:模型攻击主要指人为地制造干扰迷惑模型,使之产生错误的结果。随着深度学习模型的广泛使用,人们发现它很容易被数据的轻微扰动所欺骗,于是开始寻找更加有效的攻击方法,针对攻击又有对抗攻击的方法,二者相互推进,不仅加强了模型的健壮性,有时还能提升模型的准确度。 原理 想...
阅读全文
自然语言处理——使用词向量(腾讯词向量)
摘要:向量化是使用一套统一的标准打分,比如填写表格:年龄、性别、性格、学历、经验、资产列表,并逐项打分,分数范围[-1,1],用一套分值代表一个人,就叫作向量化,虽然不能代表全部,但至少是个量度。因此,可以说,万物皆可向量化。 词向量 同理,词也可以向量化word2...
阅读全文