初步理解知识图谱
知识图谱说白了就是一个作为数据库用的东西,那它跟数据库的区别就在于它的拓扑结构,它的表与表之间的建立的关系;
构建:
通过海量的数据提取,应该是nlp去理解一个文章或是页面中的内容中的语意去输出各种带有属性的内容,比如我理解了n份报纸,输出了多个表格,表头可能包括:
日期、标题、颜色等..然后通过很多这种表格通过建立关系把他们联系起来,然后在查询的时候比如mysql查询就是一个相对固定的内容,但是知识图谱的话可能就是很多
带有属性的数据,比如问了模型一个症状,它不仅输出这个症状是什么还有那些类似症状的病因、注意事项、治疗方式等可能是理解了多份报纸建立的联系中的数据。
作用:
是根据业务而言的垂域构建,就当前的项目来说,我通过人工标注的所有卡片、表格、图表,去提取其中的信息构建出来的业务知识图谱,里面包含了图层、布局、等结构
通过这些信息就能分别推荐出来各种类型 在需要的时候。
使用:
再比如说美团的搜索,抖音的搜索,你搜什么东西它会找到汉堡呢,搜什么能推荐到哪几家店,这就属于他们在饮食这个垂域里构建出来的关系,也就是上面说的需要根据
业务来构建。
构建方式应该是通过大量语意理解或者人工的方式去建立表之间的联系,构建应该得有很多数据,图谱是个很成熟的技术了,就业务去构建感觉用处会多点,之前我们没用
到,现在的项目用到了推荐语料素材等。