06 2022 档案
摘要:简单线性回归¶ 简单线性回归代码¶ Step 1: 数据预处理¶ In [ ]: import pandas as pd import numpy as np import matplotlib.pyplot as plt dataset = pd.read_csv('data/studentsco
阅读全文
摘要:4 文本表示模型 TF-IDF TF-IDF(term frequency–inverse document frequency)是一种用于信息检索与数据挖掘的常用加权技术,常用于挖掘文章中的关键词,而且算法简单高效,常被工业用于最开始的文本数据清洗。 TF-IDF有两层意思,一层是"词频"(Ter
阅读全文
摘要:MarkDown 学习笔记 MarkDown 简介 Markdown 是一种轻量级的标记语言,可用于在纯文本文档中添加格式化元素。Markdown 由 John Gruber 于 2004 年创建,如今已成为世界上最受欢迎的标记语言之一。 专注于文字内容 纯文本,易读易写,可以方便地纳入版本控制 语
阅读全文
摘要:leidenalg包教程 安装 简单来说,可以使用pip install leidenalg直接安装。 也可以使用源码进行安装, 安装这个包需要C核心库igraph和python包python-igraph,然后可以通过python setup.py test安装 不建议Windows,使用源代码进
阅读全文
摘要:一、特征工程 对原始数据进行一系列工程处理,将其提炼为特征,作为输入供算法和模型使用。从本质上来讲,特征工程是一个表示和展现数据的过程。在实际工作中,特征工程旨在去除原始数据中的杂质和冗余,设计更高效的特征以刻画求解的问题与预测模型之间的关系。 以下主要针对结构化数据和非结构化数据进行特征选择。 1
阅读全文
摘要:本体与知识图谱 在这篇博客中,将引导您了解本体和知识知识图谱,讲述它们之间的区别以及它们如何组织大量数据和信息。 英文原文链接 什么是本体? 本体是语义数据模型,用于定义domain中事物的类型以及可用于描述它们的属性。本体是广义的数据模型,这意味着它们仅对具有某些属性的事物的一般类型进行建模,而并
阅读全文