1.28学习日记

1.目前还是在看MTB的代码,其中预训练的部分,有很多不明白的,地方:

使用的预训练的数据集是cnn.txt,不知道是否是使用的QA数据集https://cs.nyu.edu/~kcho/DMQA/

它整个的格式是这个样子的:

分为两个部分:一个是短文,另一个是4个@highlight,强调部分的文字并不标准在短文中出现,是summary性的。

从上述的链接中可以知道,这些附带的是问题,缺少一个单词或短语,可以从短文中找到。(也就是说也是个完形填空的类型?)

cnn数据集中有大约9万个文档,有38万个问题。

#不对,上面应该是理解错了,上面是story,下面才是问题question:

 

下载下来就是为了看里面的格式

那么既然有这个question文件,要story还有啥用?

2.作者给出了预训练模型的文件

 运行时出现了以下问题:

 尝试使用:python -m spacy download en_core_web_lg 下载,但是失败:

 日,使用python3 -m spacy download en_core_web_lg,就可以下载!意思是要指定python的版本咯?但是我目前使用的conda环境就是python3的!

4.对于所使用的spacy的包,https://github.com/explosion/spacy-models/releases//tag/en_core_web_lg-2.2.5,原来分别都是这个意思啊:

 https://github.com/explosion/spaCy/issues/2405

这里学习spaCy例子,非常好!如果对一个内容找不到对应的教程,那么就搜索关键词+example。

 它能够获取到文本中所有的实体。

1.30日————————————————

1.这里类中使用这个函数是什么意思?

 https://stackoverflow.com/questions/43627405/understanding-getitem-method

class Person:
    def __init__(self,name,age):
        self.name = name
        self.age = age

    def __getitem__(self,key):
        print ("Inside `__getitem__` method!")
        return getattr(self,key)

p = Person("Subhayan",32)
print (p["age"])

也就是说在获取本类对象的属性时所调用的,可以很方便的获取到属性值,通过.就可以。

1.31日——————————————

1.这里MTB论文中提到的关系提取是针对一个句子中两个实体的关系

上面的例子中,e1和e2是部分和整体的关系,嗯。

2.安装seqeval包时遇到了这个问题

https://blog.csdn.net/weixin_41923658/article/details/96127770

应该是因为安装它就自动安装了最新版的tensorflow所以出现的问题。

2.1日————————

3.遇到了这个问题,已解决

https://github.com/ipython/ipython/issues/10627

就是在运行时,python文件中用matplot创建的图并不能保存到文件中。

再次感觉遇到bug可别找百度,找谷歌啊。

posted @ 2020-01-29 14:34  lypbendlf  阅读(296)  评论(0编辑  收藏  举报