11 2022 档案
摘要:Deep Net爬虫 Deep Web是相对于Surface Web和Dark Web而言的,是互联网页面的几种形态。 DeepWeb指存储在网络数据库里,不能通过超链接访问而需要动态网页技术访问的资源集合。网络数据库包括搜索引擎数据库、在线专业数据库及站内搜索数据库,统称为可搜索数据库(Searc
阅读全文
摘要:论文简介 论文提出一个新的框架,通过对抗过程评估生成模型。论文中同时训练两个网络:一个生成模型G用来捕获数据分布,一个有识别力的模型D用来评估来自训练数据样本的可能性。G的训练过程是去最大化D犯错的可能性。这个框架对应一个minimax的双人游戏。在G和D的任意函数空间,存在一个独特的解,G回复训练
阅读全文
摘要:BERT:Pre-training of Deep Bidirectional Transformers for Language Understanding 介绍 谷歌智能语言实验室的Jacob Devlin,Ming-Wei Chang等人提出一种新的语言表征模型——BERT(Bidirecti
阅读全文
摘要:摘要 主流的序列转换模型都是基于复杂的循环或者卷积神经网络,需要进行解码器和编码器处理。表现最好的模型也是基于注意力机制,并连接编码器和解码器。本文提出一个新的简单网络结构:Transformer,同样基于注意力机制,不再依赖RNN或者CNN。基于两种机器翻译任务的实验显示这些模型质量更优同时并行度
阅读全文