摘要:
1、 A simple Theoretical model of importance for summarization conference: ACL 2019 abstract: Research on summarization has mainly been driven by empir 阅读全文
摘要:
最近一直在做的意见解释挖掘任务,尝试加入词性特征和句法特征来提高性能。 一、方法 调研了一下大概可以有3种方法在分类模型中加入句法特征: 1. 直接使用stanford nlp工具得到每个词的父亲结点信息作为该词的句法特征加入分类模型。 2. 用treelstm训练树型结构模型,得到树中每个结点的信 阅读全文
摘要:
最近在做的分词词性标注联合训练,在深度学习模型中,通常词向量带给模型性能的影响是很大的,所以我们希望在训练词向量的过程中加入词性特征,来进一步提升模型性能。那怎么训练带有词性特征的词向量呢,接下来我将把训练过程记录下来分享给大家。 阅读全文
摘要:
一、背景: 最近在做意见解释分类任务,数据集中出现了严重的类别不均衡的问题,类别1的数目大概只有类别2的七分之一,类别2的数目大概占全部数据集的一大半了。在这种情况下,模型训练容易忽视小类而偏向大类,而小类别信息对我们来说也是非常重要的,我们也希望能提取更多的小类的特征,提高小类别的准确率。所以如何 阅读全文
摘要:
目录: 一、正则函数 二、re模块调用 三、贪婪模式 四、分组 五、正则表达式修饰符 六、正则表达式模式 七、常见的正则表达式 导读: 想要使用python的正则表达式功能就需要调用re模块,re模块为高级字符串处理提供了正则表达式工具。模块中提供了不少有用的函数,比如:compile函数、matc 阅读全文
摘要:
最近在做意见解释挖掘项目中解释性意见分类任务,尝试将解释性意见分类和意见解释抽取任务联合训练,在这里对最近的工作做一下整理。因为是实验室的自然科学基金项目中的子任务,项目数据暂时还未公开,在这里就不展开介绍具体任务了。 一、思路 解释性意见句的类别是依据意见句中的意见解释的内容进行定义的,那么在对句 阅读全文
摘要:
1. 减少除法,乘法,影响精度(BiaffineDParser在解决set batch size问题时也注意到了这个问题) 所以计算f值时,推荐使用下面的公式,这样也可以一眼看出F值大小,如果在c、g相同的情况下,即对于同一个句子,p越大f值越小。 2. 路径问题,如何跨目录读取文件 阅读全文
摘要:
1.HTTP请求 HTTP协议以"请求-回复"的方式工作。 客户发送请求时,可以在请求中附加数据。服务器通过解析请求,就可以获得客户传来的数据,并根据URL来提供特定的服务。 (1)GET方法 在项目中HelloWorld/HelloWorld下创建一个 search.py 文件,用于接收用户的请求 阅读全文
摘要:
1. 创建一个项目 之前在Anaconda 3里面用命令行安装了Django之后,有了可用的管理工具django-admin.py (1)用django.admin.py来创建一个项目Helloworld (2)查看项目的目录结构 因为是windows环境,所以只展示了一层。 (3)在目录下输入命令 阅读全文
摘要:
1. Matplotlib输出中文显示问题 解决方法: 加上两行代码就行 from pylab import mpl mpl.rcParams[‘font.sans-serif] = [‘SimHei’] 阅读全文