摘要:
原文链接:https://developers.googleblog.com/2017/03/xla-tensorflow-compiled.html 发布时间:2017-03 XLA helps TensorFlow retain its flexibility while eliminating 阅读全文
摘要:
原文链接:http://nlp.town/blog/sentence-similarity/ 这篇文章对比了几种当时最流行的计算句子相似度的方法。这里是代码,代码超赞! 数据集 对比实验使用了两个测试集,一个STS Benchmark数据集,一个SICK data数据集。 方法 Baseline 表 阅读全文
摘要:
原文链接:https://mp.weixin.qq.com/s/6VuovNdBGSSMq21OHfGe-w 摘要: NER的不同解码方式:CRF/指针网络/Biaffine 直接拿Transformer做NER不合适,可参考TENER 如何将实体词典融入到NER模型中?https://www.ac 阅读全文
摘要:
原文链接:https://mp.weixin.qq.com/s/svo0_mJ0RwOUA7hgc0doCw 论文链接:https://arxiv.org/abs/1911.00068 带噪学习:https://github.com/subeeshvasu/Awesome-Learning-with 阅读全文
摘要:
原文链接:https://zhuanlan.zhihu.com/p/88938220 文本相似度计算方法有2个关键组件 文本表示模型:将文本表示为计算机可以计算的数值向量,也就是提供特征; 相似度度量方法:基于文本表示向量计算文本之间的相似度; 阅读全文
摘要:
原文链接:https://mp.weixin.qq.com/s/ETnBeIIkusvdFc3a2J0QAA 以BERT为代表的预训练模型为自然语言处理领域带来了新的春天,在人机对话问题上也不例外。检索式多轮对话任务中,最有名的对话数据集就是Ubuntu Dialogue Corpus了,ACL20 阅读全文
摘要:
父亲节:每年6月第三个星期日 #!/usr/bin/env python # -*- coding: utf-8 -*- import calendar month_number = 6 sunday_index = 0 date_value_index = 0 cal = calendar.Cal 阅读全文
摘要:
母亲节:五月第二个星期日 #!/usr/bin/env python # -*- coding: utf-8 -*- import calendar month_number = 5 # 五月 sunday_index = 0 # 星期日 date_value_index = 0 cal = cal 阅读全文
摘要:
加拿大感恩节是十月第二个星期一。 美国感恩节是十一月第四个星期四。 目前最流行的还是美国的感恩节,下边是计算美国感恩节的代码,改一下参数就可以计算加拿大感恩节了。 #!/usr/bin/env python # -*- coding: utf-8 -*- month = 11 thursday = 阅读全文
摘要:
原文链接: https://mp.weixin.qq.com/s/UP1WjoJzDiGTBcMDoYZEUA 很多好文章! 阅读全文
摘要:
原文链接:https://mp.weixin.qq.com/s/rf17rA0tBkD9elqF8nHhaw 本文介绍了NER的难点以及相应的解决方案,人机对话系统中的槽位标注也是NER任务,介绍的一些方法还是很有指导意义的。 难点1: 如何命名“命名实体” 何晗在《自然语言处理入门》一书中的总结如 阅读全文
摘要:
作者每次部署更新都需要进行下列操作: 于是作者写了一个脚本,可以自动执行ssh以及登陆后的固定操作: 上述代码的关键就是在两个EOF之间,你可以ssh登陆后写自己需要的操作。 阅读全文
摘要:
原文链接:https://amitness.com/2020/02/back translation in google sheets/ 基于Google Sheets提供的翻译功能,通过反向翻译来做文本数据增强: GOOGLETRANSLATE(GOOGLETRANSLATE(A2, "en", 阅读全文
摘要:
ALBERT论文:https://arxiv.org/pdf/1909.11942.pdf 英文原文:https://amitness.com/2020/02/albert visual summary/ 译文链接:https://www.6aiq.com/article/1589833968655 阅读全文
摘要:
原文链接:https://amitness.com/2020/05/data augmentation for nlp/ 译文链接:https://blog.csdn.net/u011984148/article/details/106233312/ semantically invariant t 阅读全文
摘要:
原文链接:http://blog.sina.com.cn/s/blog_7ad48fee01019xhg.html 1. 面对问题,解决问题:避免“手里拿着榔头,看什么都像钉子”; 2. 系统的解决问题:切忌成为“没头脑”的工程师; 3. 站在用户的角度看问题:NL2SQL,用户掌握受限的自然语言比 阅读全文
摘要:
原文链接:https://mp.weixin.qq.com/s/YkVPtdWQkY 5hyoQW26UPA 如何构建基本的对话系统? 人格化的定义及如何部分实现人格化 Conversation AI主要包括三个方向 第一个方向是Task Completion,这也是业界做的比较多的,包括客服机器人 阅读全文
摘要:
原文链接:https://mp.weixin.qq.com/s/n1ASECUOWH7UY73yDiVaUg 口语理解 基于语义解析的口语理解模式,是将用户请求解析为所包含语义信息的结构化表达。其中,最典型的结构化表达是意图(描述用户的核心诉求)+ 词槽(描述意图的关键信息)的模式。常用方法有基于知 阅读全文
摘要:
原文链接:https://mp.weixin.qq.com/s/vRsqMgBUI6Nv1ieFDx5jDQ 语言与知识的关系如下图所示。比如一句话可以算作语言,为了理解语言需要依赖大量的知识。 VUI + GUI 是主流。 VUI是IoT时代的主要交互方式。 云知声车载产品出货量 1000w+(2 阅读全文
摘要:
这本书从产品、技术、运营多个角度,整体介绍了Chatbot生命周期中需求分析、数据处理、系统搭建、运营反馈等8个阶段以及为提升用户体验应有的多种能力。书中有很多不错的观点,比如: 1. 当前的人工智能更多的是解决系统1的部分,而难以解决系统2的部分。(系统1和系统2即《思考,快与慢》中的概念) 2. 阅读全文