摘要:
知识图谱的多模态数据增强表示学习 摘要 知识图谱或知识库在人工智能领域的各种应用中发挥着重要作用。在知识图谱的研究和应用中,知识表示学习是基本任务之一。现有的表示学习方法主要基于实体和关系之间的结构性知识,而在很大程度上忽略了实体之间的知识。虽然一些方法在学习表示的同时集成了实体知识,但这些方法缺乏 阅读全文
摘要:
第一章 知识表示与建模 知识图谱发展报告(2022)下载链接 (访问密码: 2096) 一、任务定义、目标和研究意义 知识表示(knowledge representation)将现实世界中的各类知识表达成计算机可存储和可计算的结构,使得计算机可以无障碍地理解所存储的知识。五大特点: 客观事物的机器 阅读全文
摘要:
Word2Vec 谷歌2013年提出的Word2Vec是目前最常用的词嵌入模型之一。Word2Vec实际是一种浅层的神经网络模型,它有两种网络结构,分别是CBOW(Continues Bag of Words)和Skip-gram。 CBOW的目标是根据上下文出现的词语来预测当前词的生成概率,如下图 阅读全文
摘要:
简单线性回归¶ 简单线性回归代码¶ Step 1: 数据预处理¶ In [ ]: import pandas as pd import numpy as np import matplotlib.pyplot as plt dataset = pd.read_csv('data/studentsco 阅读全文
摘要:
4 文本表示模型 TF-IDF TF-IDF(term frequency–inverse document frequency)是一种用于信息检索与数据挖掘的常用加权技术,常用于挖掘文章中的关键词,而且算法简单高效,常被工业用于最开始的文本数据清洗。 TF-IDF有两层意思,一层是"词频"(Ter 阅读全文
摘要:
MarkDown 学习笔记 MarkDown 简介 Markdown 是一种轻量级的标记语言,可用于在纯文本文档中添加格式化元素。Markdown 由 John Gruber 于 2004 年创建,如今已成为世界上最受欢迎的标记语言之一。 专注于文字内容 纯文本,易读易写,可以方便地纳入版本控制 语 阅读全文
摘要:
leidenalg包教程 安装 简单来说,可以使用pip install leidenalg直接安装。 也可以使用源码进行安装, 安装这个包需要C核心库igraph和python包python-igraph,然后可以通过python setup.py test安装 不建议Windows,使用源代码进 阅读全文
摘要:
一、特征工程 对原始数据进行一系列工程处理,将其提炼为特征,作为输入供算法和模型使用。从本质上来讲,特征工程是一个表示和展现数据的过程。在实际工作中,特征工程旨在去除原始数据中的杂质和冗余,设计更高效的特征以刻画求解的问题与预测模型之间的关系。 以下主要针对结构化数据和非结构化数据进行特征选择。 1 阅读全文
摘要:
本体与知识图谱 在这篇博客中,将引导您了解本体和知识知识图谱,讲述它们之间的区别以及它们如何组织大量数据和信息。 英文原文链接 什么是本体? 本体是语义数据模型,用于定义domain中事物的类型以及可用于描述它们的属性。本体是广义的数据模型,这意味着它们仅对具有某些属性的事物的一般类型进行建模,而并 阅读全文
摘要:
python 学习笔记 函数 函数简介 函数以def关键词开头,后接函数名和圆括号()。 函数执行的代码以冒号起始,并且缩进。 return [表达式] 结束函数,选择性地返回一个值给调用方。不带表达式的return相当于返回None。 def functionname (parameters): 阅读全文