业务领域建模Domain Modeling
我的工程实践题目是《针对领域知识的中文知识图谱自动化构建》,我将按照下面的步骤进行业务领域建模Domain Modeling:
♦ 1) Collect application domain information
– focus on the functional requirements – also consider other requirements and documents
收集领域信息,主要关注功能需求,同时还要考虑其它需求以及文档。
功能需求:
①数据获取
②知识图谱自动构建
③自动生成特定领域的问题及回答
④评估被试者的领域专业水平
♦ 2) Brainstorming
– listing important application domain concepts – listing their properties/attributes – listing their relationships to each other
列出重要的应用领域概念–列出它们的属性–列出它们之间的关系
①数据获取:网络爬虫(爬取源,待爬地址,已爬地址,数据存储路径,继承)、数据集导入(数据集路径,数据集类型,继承)、手动添加(头部实体,尾部实体,关系类型,实体属性,继承)等
②知识图谱构建:实体识别(实体id,实体名称,领域,聚合)、关系抽取(关系id,关系名称,聚合)、属性抽取(实体id,属性值,聚合)、实体对齐(实体id,实体名称,聚合)、质量评估(准确率,召回率,聚合)等
③问答生成:知识图谱搜索(限定领域,限定实体,限定关系,聚合)、语句生成(三元组,聚合)等
④专业水平评估:测试成绩生成(知识难度,回答匹配度,继承)
♦ 3) Classifying the domain concepts into:
– classes – attributes / attribute values – relationships
• association, inheritance, aggregation
将领域概念分为:–类–属性值–关系
分为四类:数据获取类,知识图谱构建类,问答生成类,专业水平评估类。
♦ 4) Document result using UML class diagram
业务类图如下图所示: