摘要:
今天再次学习知识图谱最重要的一步,知识的抽取,学习了一般,有别的事情就耽搁了,明天继续学习。 总结以下,重新了解了实体抽取的方法,基于规则的,神经网络等等,有很多现成的成熟的算法。 这些方法在输入数据集时,是不识别字符串的,而是特征向量,知识图谱字符串来描述特征也是不太好的,所以我们需要有一步转化词 阅读全文
摘要:
今天依旧学习知识图谱,感觉就是一个实体-->关系-->实体的知识库,而构建这样一个知识库的过程,需要用到 知识的获取:爬虫网路等等 知识的抽取:抽取实体,关系,属性等等 知识的融合:如张翼德和张飞是同一个人 知识的消歧:如同名不同人 指代消除:如小明是个好孩子,他的朋友李华也是。这个他指的就是小明。 阅读全文
摘要:
今天又去看了看题目,明天就要进行第三次开会,所以又看了看题目,斟酌了一下,还看了看知识图谱的一个关于医药的案例。 阅读全文
摘要:
今天又是学习知识图谱的一天,依旧蒙蔽,词向量,难道是根据词向量通过模型计算为别的数值,再转化为文字。明天继续,加油! 阅读全文
摘要:
NLP自然语言处理 分词 文本特征提取方法:表示模型:向量空间模型相似度比较:内积计算,Cosine计算词权重提取算法:词频-逆向文件频率(TF-IDF)LSA潜在语义分析 阅读全文
摘要:
今天重新看了看老师的讲义ppt,学习了一下实体抽取和关系抽取,但是对于算法模型的建立还是没有多少了解,有点懵,明天继续学习。 阅读全文
摘要:
import moxing as mox mox.file.copy_parallel('/', 'obs://') 阅读全文
摘要:
今天软件杯提交作品,忙活了一天,建议多看华为云官方文档,网上的教程少的可怜。 忙到这时候准备看一会教学视频睡觉了。 阅读全文
摘要:
今天去看了看知网的数据爬取,有重新构思了一下,准备挑战一下论文的分类和热门的自动分析等等,挑战一下先。 阅读全文
摘要:
今天老师开第二次会,对选题进行了调整。 阅读全文