摘要: 开始之前,导入numpy、pandas包和数据 #加载所需的库 import numpy as np import pandas as pd #加载数据train.csv df = pd.read_csv("train.csv") df.head(5) 2 第二章:数据清洗及特征处理 我们拿到的数据 阅读全文
posted @ 2021-09-25 15:54 LeoSharh 阅读(52) 评论(0) 推荐(0) 编辑
摘要: 文章目录 Python数据分析-matplotlib导入双轴图的画法5.电影时长和电影评分绘制散点图6.地区的评分箱形图 盒须图计算过程plt.box(x,notch,sym labels,whis)美国电影评分的箱线图多组数据箱线图 6.相关系数矩阵图-热力图pandas本身封装了画图函数各个属性 阅读全文
posted @ 2021-09-25 11:34 LeoSharh 阅读(52) 评论(0) 推荐(0) 编辑
摘要: 文章目录 1.Matplotlib 基础plt.plot()函数基本用法字符参数指定坐标轴axis显示范围plot传入numpy数组线条属性plt.plot()返回值设置线条属性plt.setp() 修改线条性质子图 电影数据绘图每个国家地区电影数量的柱状图 bar chart每年上映电影数量的曲线 阅读全文
posted @ 2021-09-24 23:59 LeoSharh 阅读(32) 评论(0) 推荐(0) 编辑
摘要: (1)读取数据。读取之前作业保存的“酒店数据1.xlsx” (2)将“类型”和“名字”设置为层次化索引,并交换索引的位置。然后将层次化索引取消 (3)将数据集转置,获取转制后的index和columns。 (4)用Groupby方法来计算每个地区的评分人数的总和以及均值。 (5)用Grouby方法计 阅读全文
posted @ 2021-09-24 18:08 LeoSharh 阅读(104) 评论(0) 推荐(0) 编辑
摘要: 阅读全文
posted @ 2021-09-24 15:54 LeoSharh 阅读(17) 评论(0) 推荐(0) 编辑
摘要: 数据的重塑和轴向旋转 行列层次化索引Series转DataFrame索引交换层次每个索引项都是个元组 按正常索引序列访问既可数据旋转/行列转化 转置 import numpy as np import pandas as pd df=pd.read_excel("movie_data2.xlsx") 阅读全文
posted @ 2021-09-23 21:15 LeoSharh 阅读(32) 评论(0) 推荐(0) 编辑
摘要: 题目 如果你是哈利·波特迷,你会知道魔法世界有它自己的货币系统 —— 就如海格告诉哈利的:“十七个银西可(Sickle)兑一个加隆(Galleon),二十九个纳特(Knut)兑一个西可,很容易。”现在,给定哈利应付的价钱 P 和他实付的钱 A,你的任务是写一个程序来计算他应该被找的零钱。 输入格式: 阅读全文
posted @ 2021-09-19 17:04 LeoSharh 阅读(17) 评论(0) 推荐(0) 编辑
摘要: 文章目录 第一章:探索性数据分析1.6 了解你的数据吗?1.6.1 任务一:利用Pandas对示例数据进行排序,要求升序1.6.2 任务二:对泰坦尼克号数据(trian.csv)按票价和年龄两列进行综合排序(降序排列),从这个数据中你可以分析出什么?1.6.3 任务三:利用Pandas进行算术计算, 阅读全文
posted @ 2021-09-14 18:26 LeoSharh 阅读(41) 评论(0) 推荐(0) 编辑
摘要: 文章目录 第一章:数据载入及初步观察1.4 知道你的数据叫什么1.4.1 任务一:pandas中有两个数据类型DateFrame和Series,通过查找简单了解他们。然后自己写一个关于这两个数据类型的小例子🌰[开放题]1.4.2 任务二:根据上节课的方法载入"train.csv"文件1.4.3 任 阅读全文
posted @ 2021-09-14 09:51 LeoSharh 阅读(34) 评论(0) 推荐(0) 编辑
摘要: 刷简单题时用到的技巧 还是总结一下 #include<iostream> #include<cmath> using namespace std; int main() { double a=1.5; cout<<(int)a<<endl; //0.5是向下取整的 cout<<ceil(a)<<en 阅读全文
posted @ 2021-09-14 09:11 LeoSharh 阅读(49) 评论(0) 推荐(0) 编辑