摘要: 今天整理了机器阅读理解的数据集和模型。只针对机器阅读理解任务。 资料 https://gluebenchmark.com/tasks https://github.com/CLUEbenchmark/CLUE https://www.cluebenchmarks.com/ https://githu 阅读全文
posted @ 2020-03-27 12:59 宋岳庭
摘要: 因为依赖gpu,机器比较贵,最近开始集中做这个实验。 经历了5次操作系统、显卡驱动、GPU、CUDA、CUDNN的选择,终于安装成功,可以运行了。一把辛酸泪。。。 操作系统 Welcome to Ubuntu 16.04.6 LTS (GNU/Linux 4.4.0 174 generic x86_ 阅读全文
posted @ 2020-03-25 17:32 宋岳庭
摘要: 本文仅供学习使用 CrossWOZ清华大学CoAI实验室做的任务型中文跨域对话系统数据集,模拟北京游客进行酒店、景点、餐馆、地铁、出租车共5个领域进行对话。 文中详细介绍了多轮对话的NLU、DST、Policy、NLG各个模块。 提供了基准实验,基于ConvLab2和基于规则。 作者解读了自己的论文 阅读全文
posted @ 2020-03-19 08:17 宋岳庭
摘要: 2019年调研过的问答系统 主要有: DrQA:开放域问答系统 BiQA:生物医疗领域问答系统,偏重机器阅读理解 DialoGPT:预训练语言生成模型 InsuranceQA:保险领域的问答系统,有中文的 BiQA Pre trained Language Model for Biomedical 阅读全文
posted @ 2020-03-10 21:25 宋岳庭
摘要: 几年前做过一次,忘了。 最近又有这方面的安排,再看看。 https://developers.weixin.qq.com/doc/offiaccount/Basic_Information/Access_Overview.html 参考 https://www.cnblogs.com/han108/ 阅读全文
posted @ 2020-03-09 21:44 宋岳庭
摘要: "阿里云文档" "elastic文档" 创建索引,参考 https://help.aliyun.com/document_detail/155919.html?spm=a2c4g.11186623.6.767.56c513e53sIJNr https://help.aliyun.com/docume 阅读全文
posted @ 2020-03-09 15:47 宋岳庭
摘要: ``` import pandas as pd data = pd.read_excel('XX.xls') data.to_csv('words.txt', sep='\t') 第j列 data.iloc[:, j] 第i行 data.iloc[i,:] 赋值 data.iloc[2, 3] = 0.98 ``` 阅读全文
posted @ 2020-03-05 19:58 宋岳庭
摘要: Pre trained Language Model for Biomedical Question Answering Yoon, W., Lee, J., Kim, D., Jeong, M., & Kang, J. (2019). Pre trained Language Model for 阅读全文
posted @ 2020-03-05 15:50 宋岳庭
摘要: 可用的语料数据集:数据驱动的对话系统 A Survey of Available Corpora for Building Data Driven Dialogue Systems 阅读全文
posted @ 2020-03-05 15:45 宋岳庭
摘要: 只有明确了研究对象、了解目标,才能设计研究思路和方法。 所以我调研了端到端的会话系统的数据集。 A User Simulator for Task Completion Dialogues End to End Optimization of Task Oriented Dialogue Model 阅读全文
posted @ 2020-03-05 15:44 宋岳庭
