文章分类 -  机器学习

摘要:使用逻辑回归预测 IPO 市场 1 IPO 市场 在开始建模之前,先讨论一下什么是 IPO(或首次公开募股),以及关于这个市场,研究的结果能了解些什么。之后可以指定一些可以应用的策略。 1.1 什么是 IPO 首次公开募股是一家私人公司成为上市公司的过程。公开发行为公司募集资金,并让公众通过购买其股 阅读全文
posted @ 2024-04-15 13:52 Rescal_子轩 阅读(129) 评论(1) 推荐(0) 编辑
摘要:Python 库和功能 对数据科学工作流的每一步有了初步的理解之后,下面来看看在每一步中,存在哪些有用的 Python 库和功能可供选择。 2.1 获取 访问数据常见的方式之一是通过 REST 风格的 API 接口,需要知道的库是 Python Request库(http://www.python- 阅读全文
posted @ 2024-04-14 21:23 Rescal_子轩 阅读(6) 评论(0) 推荐(0) 编辑
摘要:机器学习( /数据科学)的工作流程 打造机器学习的应用程序,与标准的工程范例在许多方面都是类似的,不过有一个非常重要的方法有所不同:需要将数据作为原材料来处理。数据项目成功与否,很大程度上依赖于你所获数据的质量,以及它是如何被处理的。由于数据的使用属于数据科学的领域,理解数据科学的工作流程对于我们也 阅读全文
posted @ 2024-04-13 18:01 Rescal_子轩 阅读(22) 评论(0) 推荐(0) 编辑
摘要:PyTorch 入门 PyTorch 是由 Facebook 主导开发的深度学习框架,因其高效的计算过程以及良好的易用性被诸多大公司和科研人员所喜爱。18 年 5 月,PyTorch 正式宣布集成 Caffe2 和 ONNX 的功能,这是一次让业界期待的更新。本次实验中,我们将从整体上熟悉 PyTo 阅读全文
posted @ 2024-03-28 21:18 Rescal_子轩 阅读(29) 评论(0) 推荐(0) 编辑
摘要:tensorflow 摘要: 深度学习的关键,其实在于深度神经网络的构建,而如果你从 0 开始自己编程构建一个深度神经网络,那么过程将会是十分复杂的。所以,为了更方便地实现深度学习模型,我们需要掌握一些常见的深度学习框架的使用。目前在整个深度学习社区里,比较流行的框架有 TensorFlow 和 P 阅读全文
posted @ 2024-03-28 20:09 Rescal_子轩 阅读(27) 评论(0) 推荐(0) 编辑
摘要:聚类 聚类是无监督学习算法中的一种。聚类背后的主要思想相对简单,往往可以根据数据点之间的距离来将同类样本聚合在一起。 知识点 K-Means 近邻传播 谱聚类 凝聚聚类 聚类 K-Means 聚类 K-Means 算法是所有聚类算法中最流行且最简单的算法。 下面是它的工作原理: 选择认为最佳的类别数 阅读全文
posted @ 2024-03-24 13:31 Rescal_子轩 阅读(20) 评论(0) 推荐(0) 编辑
摘要:主成分分析 无监督学习是机器学习中的一类重要算法。与监督学习算法相比,无监督学习算法不需要对输入数据进行标记,即不需要给出标签或类别。此外,无监督学习算法还可以在没有辅助的情况下能够学习数据的内在关系。由于数据不需要手动标记标签,这可以使许多无监督算法能够处理大量的数据,从而节省了大量的人力成本。但 阅读全文
posted @ 2024-03-24 13:07 Rescal_子轩 阅读(23) 评论(0) 推荐(0) 编辑
摘要:特征工程和特征选择 摘要:通过特征提取、特征转换、特征选择三个过程介绍数据预处理方法,特征提取将原始数据转换为适合建模的特征,特征转换将数据进行变换以提高算法的准确性,特征选择用来删除无用的特征。 准备数据 本次使用 Renthop 公司的数据集。首先载入数据集。 下载数据 # 下载数据并解压 !w 阅读全文
posted @ 2024-03-24 12:51 Rescal_子轩 阅读(32) 评论(0) 推荐(0) 编辑
摘要:集成学习和随机森林方法 集成学习的概念及主要方法,包括 Bootstraping、Bagging、随机森林,随后计算随机森林中各个特征的重要性,找出对模型贡献较大的特征。 集成 现在,假设已经为某一特定问题选中了最佳的模型,想进一步提升其准确率,就需要应用一些更高级的机器学习技术:集成(Ensemb 阅读全文
posted @ 2024-03-23 21:54 Rescal_子轩 阅读(147) 评论(0) 推荐(0) 编辑
摘要:决策树算法 定义 决策树是分类与回归问题中常用的方法之一。其实不仅是机器学习领域,在每天的日常决策中,我们都在使用决策树。 决策树常常是专家经验的概括,是一种分享特定过程知识的方式。例如,在引入可扩展机器学习算法之前,银行业的信用评分任务是由专家解决的,能否放贷是基于一些直观(或经验)的规则,这些规 阅读全文
posted @ 2024-03-23 11:30 Rescal_子轩 阅读(39) 评论(0) 推荐(0) 编辑
摘要:逻辑回归 基本概念 逻辑回归是一种用于处理分类问题的统计学习方法,尽管名字中带有"回归"一词,但实质上是一种分类算法。逻辑回归适用于二分类问题,即将数据分为两个类别(比如是/否、成功/失败等),逻辑回归是一种分类方法,而并不是回归方法。需要牢牢记住,不要混淆。 线性可分和不可分 首先,了解一个概念, 阅读全文
posted @ 2024-03-22 22:22 Rescal_子轩 阅读(7) 评论(0) 推荐(0) 编辑
摘要:一、线性回归介绍 知识点 一元线性回归 平方损失函数 最小二乘法及代数求解 线性回归实现 最小二乘法的矩阵推导 介绍 线性回归是一种用于建立和预测变量之间线性关系的统计方法。在线性回归中,假设因变量(或响应变量)与一个或多个自变量(或预测变量)之间存在线性关系,即可以通过一个线性方程来描述二者之间的 阅读全文
posted @ 2024-03-22 21:11 Rescal_子轩 阅读(3) 评论(0) 推荐(0) 编辑
摘要:基本形式 线性模型的基本形式是: y = w₁x₁ + w₂x₂ + ... + wᵣxᵣ + b 其中,y是模型预测的输出结果,w₁, w₂, ..., wᵣ是特征的权重(或系数),x₁, x₂, ..., xᵣ是输入特征,b是偏置项(即截距)。 这个基本形式可以用于解决各种问题,例如回归问题和分 阅读全文
posted @ 2023-03-29 22:09 Rescal_子轩 阅读(230) 评论(0) 推荐(0) 编辑
摘要:机器学习 概念 机器学习是一种人工智能技术,它利用计算机算法分析数据模式和规律,从而自动地改善任务的性能。在机器学习中,计算机系统通过从数据中学习来自主适应,并不断提高自己的表现。这些数据可以是结构化的、非结构化的或半结构化的,其应用领域包括图像识别、语音识别、自然语言处理、推荐系统和预测等。 目标 阅读全文
posted @ 2023-03-29 21:44 Rescal_子轩 阅读(10) 评论(0) 推荐(0) 编辑

点击右上角即可分享
微信分享提示