06 2022 档案

摘要:简单线性回归¶ 简单线性回归代码¶ Step 1: 数据预处理¶ In [ ]: import pandas as pd import numpy as np import matplotlib.pyplot as plt dataset = pd.read_csv('data/studentsco 阅读全文
posted @ 2022-06-23 15:59 huggingAha 阅读(135) 评论(0) 推荐(0) 编辑
摘要:4 文本表示模型 TF-IDF TF-IDF(term frequency–inverse document frequency)是一种用于信息检索与数据挖掘的常用加权技术,常用于挖掘文章中的关键词,而且算法简单高效,常被工业用于最开始的文本数据清洗。 TF-IDF有两层意思,一层是"词频"(Ter 阅读全文
posted @ 2022-06-19 16:48 huggingAha 阅读(366) 评论(0) 推荐(0) 编辑
摘要:MarkDown 学习笔记 MarkDown 简介 Markdown 是一种轻量级的标记语言,可用于在纯文本文档中添加格式化元素。Markdown 由 John Gruber 于 2004 年创建,如今已成为世界上最受欢迎的标记语言之一。 专注于文字内容 纯文本,易读易写,可以方便地纳入版本控制 语 阅读全文
posted @ 2022-06-18 19:40 huggingAha 阅读(361) 评论(0) 推荐(0) 编辑
摘要:leidenalg包教程 安装 简单来说,可以使用pip install leidenalg直接安装。 也可以使用源码进行安装, 安装这个包需要C核心库igraph和python包python-igraph,然后可以通过python setup.py test安装 不建议Windows,使用源代码进 阅读全文
posted @ 2022-06-18 00:45 huggingAha 阅读(4328) 评论(0) 推荐(0) 编辑
摘要:一、特征工程 对原始数据进行一系列工程处理,将其提炼为特征,作为输入供算法和模型使用。从本质上来讲,特征工程是一个表示和展现数据的过程。在实际工作中,特征工程旨在去除原始数据中的杂质和冗余,设计更高效的特征以刻画求解的问题与预测模型之间的关系。 以下主要针对结构化数据和非结构化数据进行特征选择。 1 阅读全文
posted @ 2022-06-18 00:21 huggingAha 阅读(169) 评论(0) 推荐(0) 编辑
摘要:本体与知识图谱 在这篇博客中,将引导您了解本体和知识知识图谱,讲述它们之间的区别以及它们如何组织大量数据和信息。 英文原文链接 什么是本体? 本体是语义数据模型,用于定义domain中事物的类型以及可用于描述它们的属性。本体是广义的数据模型,这意味着它们仅对具有某些属性的事物的一般类型进行建模,而并 阅读全文
posted @ 2022-06-13 20:06 huggingAha 阅读(908) 评论(0) 推荐(0) 编辑

点击右上角即可分享
微信分享提示