Loading

上一页 1 ··· 5 6 7 8 9 10 11 12 13 ··· 15 下一页
摘要: 随机抽样,是统计学中常用的一种方法,它可以帮助我们从大量的数据中快速地构建出一组数据分析模型。在 Pandas 中,如果想要对数据集进行随机抽样,需要使用 sample() 函数。 sample() 函数的语法格式如下: DataFrame.sample(n=None, frac=None, rep 阅读全文
posted @ 2023-01-31 22:34 ThankCAT 阅读(125) 评论(0) 推荐(0) 编辑
摘要: 当进行数据分析时,我们会遇到很多带有日期、时间格式的数据集,在处理这些数据集时,可能会遇到日期格式不统一的问题,此时就需要对日期时间做统一的格式化处理。比如“Wednesday, June 6, 2020”可以写成“6/6/20”,或者写成“06-06-2020。 日期格式化符号 在对时间进行格式化 阅读全文
posted @ 2023-01-31 22:34 ThankCAT 阅读(216) 评论(0) 推荐(0) 编辑
摘要: 顾名思义,时间序列(time series),就是由时间构成的序列,它指的是在一定时间内按照时间顺序测量的某个变量的取值序列,比如一天内的温度会随时间而发生变化,或者股票的价格会随着时间不断的波动,这里用到的一系列时间,就可以看做时间序列。时间序列包含三种应用场景,分别是: 特定的时刻(timest 阅读全文
posted @ 2023-01-31 22:33 ThankCAT 阅读(33) 评论(0) 推荐(0) 编辑
摘要: Teams基本功能介绍 活动 活动相当于是Teams中的通知,它会将与你有关计划,消息,@,未接来电等消息在活动中罗列出来,便于随时查找跟进。 聊天 聊天功能是Teams中与组织内成员进行及时沟通的工具,它可以搜索到组织中的任何一个人,并与他开始新的聊天对话。聊天功能中可以可以时间视频通话,语音通话 阅读全文
posted @ 2023-01-30 22:49 ThankCAT 阅读(3092) 评论(0) 推荐(0) 编辑
摘要: groupby分组操作详解 在数据分析中,经常会遇到这样的情况:根据某一列(或多列)标签把数据划分为不同的组别,然后再对其进行数据分析。比如,某网站对注册用户的性别或者年龄等进行分组,从而研究出网站用户的画像(特点)。在 Pandas 中,要完成数据的分组操作,需要使用 groupby() 函数,它 阅读全文
posted @ 2023-01-29 22:21 ThankCAT 阅读(89) 评论(0) 推荐(0) 编辑
摘要: Pandas 提供的 merge() 函数能够进行高效的合并操作,这与 SQL 关系型数据库的 MERGE 用法非常相似。从字面意思上不难理解,merge 翻译为“合并”,指的是将两个 DataFrame 数据表按照指定的规则进行连接,最后拼接成一个新的 DataFrame 数据表。 merge() 阅读全文
posted @ 2023-01-29 22:21 ThankCAT 阅读(103) 评论(0) 推荐(0) 编辑
摘要: 字符串离散化处理 import pandas as pd import numpy as np from matplotlib import pyplot as plt # 读取csv文件 file_path = "./IMDB-Movie-Data.csv" df = pd.read_csv(fi 阅读全文
posted @ 2023-01-29 22:20 ThankCAT 阅读(37) 评论(0) 推荐(0) 编辑
摘要: 认识DataFrame结构 DataFrame 一个表格型的数据结构,既有行标签(index),又有列标签(columns),它也被称异构数据表,所谓异构,指的是表格中每列的数据类型可以不同,比如可以是字符串、整型或者浮点型等。其结构图示意图,如下所示: 表格中展示了某个销售团队个人信息和绩效评级( 阅读全文
posted @ 2023-01-28 21:52 ThankCAT 阅读(157) 评论(0) 推荐(0) 编辑
摘要: Series 结构,也称 Series 序列,是 Pandas 常用的数据结构之一,它是一种类似于一维数组的结构,由一组数据值(value)和一组标签组成,其中标签与数据值之间是一一对应的关系。 Series 可以保存任何数据类型,比如整数、字符串、浮点数、Python 对象等,它的标签默认为整数, 阅读全文
posted @ 2023-01-28 21:20 ThankCAT 阅读(139) 评论(0) 推荐(0) 编辑
摘要: Numpy基本使用方法 第一节 创建数组 import numpy as np import random # 创建数组 a = [1, 2, 3, 4, 5] a1 = np.array(a) print(a1) # [1 2 3 4 5] b = range(10) b1 = np.array( 阅读全文
posted @ 2023-01-18 21:03 ThankCAT 阅读(50) 评论(0) 推荐(0) 编辑
上一页 1 ··· 5 6 7 8 9 10 11 12 13 ··· 15 下一页