ThankCAT - 博客园

2023年1月31日

摘要：随机抽样，是统计学中常用的一种方法，它可以帮助我们从大量的数据中快速地构建出一组数据分析模型。在 Pandas 中，如果想要对数据集进行随机抽样，需要使用 sample() 函数。 sample() 函数的语法格式如下： DataFrame.sample(n=None, frac=None, rep 阅读全文

posted @ 2023-01-31 22:34 ThankCAT 阅读(125) 评论(0) 推荐(0) 编辑

Pandas日期时间格式化

摘要：当进行数据分析时，我们会遇到很多带有日期、时间格式的数据集，在处理这些数据集时，可能会遇到日期格式不统一的问题，此时就需要对日期时间做统一的格式化处理。比如“Wednesday, June 6, 2020”可以写成“6/6/20”，或者写成“06-06-2020。日期格式化符号在对时间进行格式化阅读全文

posted @ 2023-01-31 22:34 ThankCAT 阅读(216) 评论(0) 推荐(0) 编辑

Pandas时间序列

摘要：顾名思义，时间序列（time series），就是由时间构成的序列，它指的是在一定时间内按照时间顺序测量的某个变量的取值序列，比如一天内的温度会随时间而发生变化，或者股票的价格会随着时间不断的波动，这里用到的一系列时间，就可以看做时间序列。时间序列包含三种应用场景，分别是：特定的时刻（timest 阅读全文

posted @ 2023-01-31 22:33 ThankCAT 阅读(33) 评论(0) 推荐(0) 编辑

2023年1月30日

Teams基础功能与会议介绍

摘要： Teams基本功能介绍活动活动相当于是Teams中的通知，它会将与你有关计划，消息，@，未接来电等消息在活动中罗列出来，便于随时查找跟进。聊天聊天功能是Teams中与组织内成员进行及时沟通的工具，它可以搜索到组织中的任何一个人，并与他开始新的聊天对话。聊天功能中可以可以时间视频通话，语音通话阅读全文

posted @ 2023-01-30 22:49 ThankCAT 阅读(3092) 评论(0) 推荐(0) 编辑

2023年1月29日

Pandas分组聚合

摘要： groupby分组操作详解在数据分析中，经常会遇到这样的情况：根据某一列（或多列）标签把数据划分为不同的组别，然后再对其进行数据分析。比如，某网站对注册用户的性别或者年龄等进行分组，从而研究出网站用户的画像（特点）。在 Pandas 中，要完成数据的分组操作，需要使用 groupby() 函数，它阅读全文

posted @ 2023-01-29 22:21 ThankCAT 阅读(89) 评论(0) 推荐(0) 编辑

Pandas数据合并

摘要： Pandas 提供的 merge() 函数能够进行高效的合并操作，这与 SQL 关系型数据库的 MERGE 用法非常相似。从字面意思上不难理解，merge 翻译为“合并”，指的是将两个 DataFrame 数据表按照指定的规则进行连接，最后拼接成一个新的 DataFrame 数据表。 merge() 阅读全文

posted @ 2023-01-29 22:21 ThankCAT 阅读(103) 评论(0) 推荐(0) 编辑

Pandas字符串离散化处理

摘要：字符串离散化处理 import pandas as pd import numpy as np from matplotlib import pyplot as plt # 读取csv文件 file_path = "./IMDB-Movie-Data.csv" df = pd.read_csv(fi 阅读全文

posted @ 2023-01-29 22:20 ThankCAT 阅读(37) 评论(0) 推荐(0) 编辑

2023年1月28日

DataFrame基础

摘要：认识DataFrame结构 DataFrame 一个表格型的数据结构，既有行标签（index），又有列标签（columns），它也被称异构数据表，所谓异构，指的是表格中每列的数据类型可以不同，比如可以是字符串、整型或者浮点型等。其结构图示意图，如下所示：表格中展示了某个销售团队个人信息和绩效评级（阅读全文

posted @ 2023-01-28 21:52 ThankCAT 阅读(157) 评论(0) 推荐(0) 编辑

Series基础

摘要： Series 结构，也称 Series 序列，是 Pandas 常用的数据结构之一，它是一种类似于一维数组的结构，由一组数据值（value）和一组标签组成，其中标签与数据值之间是一一对应的关系。 Series 可以保存任何数据类型，比如整数、字符串、浮点数、Python 对象等，它的标签默认为整数，阅读全文

posted @ 2023-01-28 21:20 ThankCAT 阅读(139) 评论(0) 推荐(0) 编辑

2023年1月18日

Numpy基本使用方法

摘要： Numpy基本使用方法第一节创建数组 import numpy as np import random # 创建数组 a = [1, 2, 3, 4, 5] a1 = np.array(a) print(a1) # [1 2 3 4 5] b = range(10) b1 = np.array( 阅读全文

posted @ 2023-01-18 21:03 ThankCAT 阅读(50) 评论(0) 推荐(0) 编辑

Loading

Thank CAT

公告