上一页 1 ··· 31 32 33 34 35 36 37 38 39 ··· 64 下一页
摘要: 文章名《Deepening Hidden Representations from Pre-trained Language Models for Natural Language Understanding》,2019,单位:上海交大 从预训练语言模型中深化语言表示 摘要:基于Transforme 阅读全文
posted @ 2020-02-06 23:12 今夜无风 阅读(699) 评论(0) 推荐(1) 编辑
摘要: 摘要:预训练语言模型如BERT等已经极大地提高了多项自然处理任务的性能,然而预训练语言模型通常具需要很大计算资源,所以其很难在有限的资源设备上运行。为了加速推理、减小模型的尺寸而同时保留精度,首先提出了一个新颖的迁移蒸馏方法,它是一种基于迁移方法的知识蒸馏思路。利用整个新颖的KD方法,大量的知识编码 阅读全文
posted @ 2020-02-05 16:42 今夜无风 阅读(1229) 评论(0) 推荐(0) 编辑
摘要: 该文主要采用“知识蒸馏”方法对BERT(预训练语言模型)精简、优化,将较大模型压缩成较小的模型,最终目的是:提高模型推理的效率,让运行在智能手机等硬件设备上的深度学习模型具有轻量级、响应快及能源利用率高等特性。 在2019年的NLP领域预训练+微调的模型训练思路百家争鸣,ElMo、GPT、BERT、 阅读全文
posted @ 2020-02-03 20:08 今夜无风 阅读(1173) 评论(0) 推荐(0) 编辑
摘要: Link,Paper,Type,Model,Date,Citations https://arxiv.org/abs/1801.06146,Universal Language Model Fine-tuning for Text Classification,New Model ,ULMFiT,1 阅读全文
posted @ 2020-02-03 13:55 今夜无风 阅读(793) 评论(0) 推荐(0) 编辑
摘要: 给2020年NLP方向做一个指引: 2019 年,可谓是 NLP 发展历程中具有里程碑意义的一年,而其背后的最大功臣当属 BERT ! 2018 年底才发布,BERT 仅用 2019 年一年的时间,便以「势如破竹」的姿态成为了 NLP 领域首屈一指的「红人」,BERT 相关的论文也如涌潮般发表出来。 阅读全文
posted @ 2020-02-03 13:51 今夜无风 阅读(343) 评论(0) 推荐(0) 编辑
摘要: 多任务学习、对抗学习、知识蒸馏三大方法结合起来,效果突飞猛进??? NLP新基准SuperGLUE榜单刷新 追一科技超Facebook,地址:https://m.gmw.cn/baijia/2020-01/20/33497522.html 那么结合的方式值得我们思考讨论 阅读全文
posted @ 2020-01-21 09:27 今夜无风 阅读(145) 评论(0) 推荐(0) 编辑
摘要: 预训练文本分类地址: https://www.cnblogs.com/jiangxinyang/p/10241243.html https://www.cnblogs.com/zhouxiaosong/p/11384197.html 快速适配下游任务的工程代码:https://github.com/ 阅读全文
posted @ 2020-01-16 20:58 今夜无风 阅读(215) 评论(0) 推荐(0) 编辑
摘要: 新年伊始,NLP技术在2019年大放异彩,BERT,GPT-2,Mass,ElMo,ULMFit等预训练+精调的思维路线开辟了新的方向,也给我们这一块带来新的希望! 作为工程技术人员,我们首要就是要将更好的技术应用于产品,获取利润,那么可以在大佬的步伐下吃一波红利,指导应用开发。本人也比较懒,总结做 阅读全文
posted @ 2020-01-16 15:25 今夜无风 阅读(1384) 评论(0) 推荐(0) 编辑
摘要: 正如我前面博文所提到的,公司要求内外网隔离。在国产化设备适配时,要求设备一律不得连接互联网,要用tf环境推理,不得不安装基本环境 1)源码安装 将你所需要的所有第三方库打包,放入一个文件夹下,类型:.tar.gz或者.zip 2)注意依赖包的先后顺序 有些包是有先后依赖的,如在用到numpy、sci 阅读全文
posted @ 2020-01-15 10:49 今夜无风 阅读(1350) 评论(0) 推荐(0) 编辑
摘要: 任务:在新环境下部署一套python环境,使用tf进行推理 描述:最近在做国产化设备适配,操作系统:银河麒麟,内核:Linux-4.4.58XXX,CPU:四核 phytium FT1500a 64bit,内存:8G。主要是因为ARM架构,需要将原有工程做移植测试,观察之前的框架使用情况。 面临的问 阅读全文
posted @ 2020-01-14 09:31 今夜无风 阅读(465) 评论(0) 推荐(0) 编辑
上一页 1 ··· 31 32 33 34 35 36 37 38 39 ··· 64 下一页