摘要:
使用python的urllib来抓取网页很容易被当作爬虫来对待 下面是一个使用urllib的例子: import urllib.request url = 'http://www.jianshu.com/p/99747a2f29f7' headers = { 'Connection': 'Keep- 阅读全文
摘要:
今天继续学习知识图谱。 今天通过观看老师给的学习资料,对知识图谱的数据集制作有了一定的了解,由于还有别的事情,所以今天只了解了这部分。 大致分为数据的获取,标注方法的编写,以及最终的标注。 目标可以标准实体达到100%,这里就不作详细说明了,因为学习资料不是开源的。 阅读全文