10 2021 档案
摘要:诗人信息重新收集 收集所有诗人 诗人图片与朝代,之前收集的诗人只有2000多个,是因为之前收集的诗人有生平,而其他诗人没有,故没有收集到 这次收集所有诗人,都有个人介绍。从个人介绍中也可提取出有用的信息。 经过此次收集,共收集到20088个诗人 import requests from bs4 im
阅读全文
摘要:实体关系整理 实体关系 待解决问题 部分数据补充 诗人头像链接 考虑到后期可视化展示,有诗人的头像会更加生动一些,当初收集诗人数据时未进行爬取 import requests from bs4 import BeautifulSoup from lxml import etree import re
阅读全文
摘要:实体分析 实体 如何找出自己想求得的知识图谱的实体,在我看来一个实体所独有的是他的属性,其他实体也包含的就是实体。因而,我对诗词进行了实体-实体,实体-属性的分类。 如下图所示: 除了明显的实体之外,我还构思出一些潜在的实体,如下:诗名-类别(写山,抒情,思念等等),诗名-词牌名,诗词中的一句-飞花
阅读全文
摘要:pytorch手写体识别 代码 import torch from torch import nn from torch.nn import functional as F from torch import optim import torchvision from matplotlib impo
阅读全文
摘要:Pytorch学习笔记 张量Tensor 张量是一个统称,其中包含很多类型: 0阶张量:标量、常数,0-D Tensor 1阶张量:向量,1-D Tensor 2阶张量:矩阵,2-D Tensor 3阶张量 Pytorch中创建张量 使用python中的列表或者序列创建tensor torch.te
阅读全文
摘要:目前进度 数据爬取 唐诗5万首,宋诗20万首, 元诗4万首,明诗5万首,清诗9万多首,诗人1834个 诗词表字段详情: 诗人表字段详情: 下周进度 一、找出新的实体关系,目前的实体关系都是已知的(诗人,诗集),要探索一些未知的实体关系。 二、将情感分析作为重点,先将诗人的生平做语义分析,根据时间点,
阅读全文