摘要: 什么是Matplotlib 是专门用于开发2D图表(包括3D图表) 以渐进、交互式方式实现数据可视化 为什么要学习Matplotlib 可视化是在整个数据挖掘的关键辅助工具,可以清晰的理解数据,从而调整我们的分析方法。 能将数据进行可视化,更直观的呈现 使数据更加客观、更具说服力 实现一个简单的Ma 阅读全文
posted @ 2020-12-31 18:06 我在路上回头看 阅读(90) 评论(0) 推荐(0) 编辑
摘要: 界面启动创建文件 环境搭建好后, 本机输入jupyter notebook命令会自动弹出浏览器窗口打开jupyter notebook # 进入虚拟环境 workon ai # 输入命令 jupyter notebook 本地notebook的默认url为:http://localhost:8888 阅读全文
posted @ 2020-12-31 17:26 我在路上回头看 阅读(440) 评论(0) 推荐(0) 编辑
摘要: 什么是机器学习 机器学习是从数据中自动分析获得模型,并利用模型对未知数据进行预测。 机器学习工作流程 1.获取数据 2.数据基本处理 3.特征工程 4.机器学习(模型训练) 5.模型评估 获取到的数据集介绍 在数据集中一般: - 一行数据我们称为一个样本 - 一列数据我们称为一个特征 - 有些数据有 阅读全文
posted @ 2020-12-31 07:05 我在路上回头看 阅读(150) 评论(0) 推荐(0) 编辑
摘要: 案例 需求:双均线策略制定 1.使用tushare包获取某股票的历史行情数据 2.计算该股票历史数据的5日均线和30日均线 - 什么是均线? - 对于每一个交易日,都可以计算出前N天的移动平均值,然后把这些移动平均值连起来,成为一个条线,就叫做N日移动平均线。移动平均线常用线有5天,10天,30天, 阅读全文
posted @ 2020-12-31 05:02 我在路上回头看 阅读(51) 评论(0) 推荐(0) 编辑
摘要: 数据分析三剑客 numpy pandas(重点) matplotlib numpy模块 NumPy(Numerical Python)是Python语言中做科学计算的基础库。重在于数值计算,也是大部分Python科学计算库的基础,多用于在大型、多维数组上执行的数值运算, numpy的创建 1.使用n 阅读全文
posted @ 2020-12-31 03:17 我在路上回头看 阅读(103) 评论(0) 推荐(0) 编辑