摘要: 使用python的urllib来抓取网页很容易被当作爬虫来对待 下面是一个使用urllib的例子: import urllib.request url = 'http://www.jianshu.com/p/99747a2f29f7' headers = { 'Connection': 'Keep- 阅读全文
posted @ 2020-07-09 22:48 集 阅读(973) 评论(0) 推荐(0) 编辑
摘要: 今天继续学习知识图谱。 今天通过观看老师给的学习资料,对知识图谱的数据集制作有了一定的了解,由于还有别的事情,所以今天只了解了这部分。 大致分为数据的获取,标注方法的编写,以及最终的标注。 目标可以标准实体达到100%,这里就不作详细说明了,因为学习资料不是开源的。 阅读全文
posted @ 2020-07-09 22:41 集 阅读(82) 评论(0) 推荐(0) 编辑