上一页 1 ··· 7 8 9 10 11 12 13 14 15 ··· 18 下一页

2021年6月10日

1-flask 工程搭建的时候一些参数说明

摘要: 1:hello word flask from flask import Flask #flask 类接受一个__nmae__ 参数 app = Flask(__name__) #装饰器的作用事将路由映射到函数中 @app.route('/') def index(): return "hello 阅读全文

posted @ 2021-06-10 20:11 paike123 阅读(75) 评论(0) 推荐(0) 编辑

2021年6月8日

8-pandas 之分组聚合

摘要: 1 什么分组与聚合 2 分组API DataFrame.groupby(key, as_index=False) key:分组的列数据,可以多个 案例:不同颜色的不同笔的价格数据 col =pd.DataFrame({'color': ['white','red','green','red','gr 阅读全文

posted @ 2021-06-08 17:37 paike123 阅读(76) 评论(0) 推荐(0) 编辑

7-pandas 之交叉表与透视表

摘要: crosstab(交叉表) 交叉表:交叉表用于计算一列数据对于另外一列数据的分组个数(寻找两个列之间的关系) pd.crosstab(value1, value2) DataFrame.pivot_table([], index=[]) 案例分析 1 数据准备 准备两列数据,星期数据以及涨跌幅是好是 阅读全文

posted @ 2021-06-08 17:11 paike123 阅读(158) 评论(0) 推荐(0) 编辑

6-pandans之数据离散化

摘要: 1 为什么要离散化 连续属性离散化的目的是为了简化数据结构,数据离散化技术可以用来减少给定连续属性值的个数。离散化方法经常作为数据挖掘的工具。 2 什么是数据的离散化 连续属性的离散化就是在连续属性的值域上,将值域划分为若干个离散的区间,最后用不同的符号或整数 值代表落在每个子区间中的属性值。 离散 阅读全文

posted @ 2021-06-08 16:04 paike123 阅读(109) 评论(0) 推荐(0) 编辑

5-pandas 缺失值的处理

摘要: 1 如何处理nan 判断数据是否为NaN: pd.isnull(df), pd.notnull(df) 处理方式: 存在缺失值nan,并且是np.nan: 1、删除存在缺失值的:dropna(axis='rows') 注:不会修改原数据,需要接受返回值 2、替换缺失值:fillna(value, i 阅读全文

posted @ 2021-06-08 15:40 paike123 阅读(112) 评论(0) 推荐(0) 编辑

4-pandas 对文件的读取和存储

摘要: 我们的数据大部分存在于文件当中,所以pandas会支持复杂的IO操作,pandas的API支持众多的文件格式,如CSV、SQL、XLS、JSON、HDF5。 1 CSV 1.1 read_csv pandas.read_csv(filepath_or_buffer, sep =',' ) filep 阅读全文

posted @ 2021-06-08 15:17 paike123 阅读(345) 评论(0) 推荐(0) 编辑

3-DataFrame 运算

摘要: 1 算术运算 add(other) 比如进行数学运算加上具体的一个数字 data['open'].add(1) 2018-02-27 24.53 2018-02-26 23.80 2018-02-23 23.88 2018-02-22 23.25 2018-02-14 22.49 sub(other 阅读全文

posted @ 2021-06-08 14:08 paike123 阅读(85) 评论(0) 推荐(0) 编辑

2-pandas 基本操作

摘要: 本文的文件链接 https://files.cnblogs.com/files/blogs/511107/stock_day.zip # 读文件 data = pd.read_csv("./data/stock_day.csv") # 删除一些数据 data = data.drop(["ma5"," 阅读全文

posted @ 2021-06-08 11:27 paike123 阅读(60) 评论(0) 推荐(0) 编辑

1-pandas介绍

摘要: 1:pandas 介绍 2008年WesMcKinney开发出的库 专门用于数据挖掘的开源python库 以Numpy为基础,借力Numpy模块在计算方面性能高的优势 基于matplotlib,能够简便的画图 独特的数据结构 2:为什么使用pandas 便捷的数据处理能力 读取文件方便 封装了Mat 阅读全文

posted @ 2021-06-08 10:51 paike123 阅读(235) 评论(0) 推荐(0) 编辑

2021年6月7日

4-数组的运算

摘要: 1:广播机制 执行 broadcast 的前提在于,两个 ndarray 执行的是 element-wise的运算,Broadcast机制的功能是为了方便不同形状的ndarray(numpy库的核心数据结构)进行数学运算。 当操作两个数组时,numpy会逐个比较它们的shape(构成的元组tuple 阅读全文

posted @ 2021-06-07 16:42 paike123 阅读(293) 评论(0) 推荐(0) 编辑

上一页 1 ··· 7 8 9 10 11 12 13 14 15 ··· 18 下一页

导航