lxinghua

博客园 首页 新随笔 联系 订阅 管理
  117 随笔 :: 0 文章 :: 0 评论 :: 7466 阅读

随笔分类 -  0801.数据分析之基础

摘要:1. 合并1——文件格式完全相同之全部合并 #导入工具包 import pandas as pd import os # 新建空列表,用来存储所有的列表数据 df_list = [] # 循环读取Excel/csv/txt等文件 for i in os.listdir('./'): # 遍历当前代码 阅读全文
posted @ 2023-06-01 19:10 興華 阅读(133) 评论(0) 推荐(0) 编辑

摘要:一、方差分析 二、回归分析 1. 回归模型的算法说明 算法 识别 分析因子对目标变量的影响程度/大小 原理:利用统计学中的假设检验对已有数据结果进行检验判定 预测 根据已有数据建立模型,并通过建立的模型对新样本数据进行检验预测未来数据走向 原理:1. 统计学;2.机器学习 2. 回归模型的选择 模型 阅读全文
posted @ 2023-04-12 20:59 興華 阅读(41) 评论(0) 推荐(0) 编辑

摘要:指标、指标体系 一、指标 何谓指标?指标是说明总体数量特征的概念及其数据的综合,故又称为综合指标。在实际的统计工作和统计理论研究中,往往直接将说明总体数量特征的概念称为指标。 二、北极星指标 北极星指标是衡量产品、业务成功与否的关键指标,它体现了产品试图解决的“用户需求与企业经营”之间的关系,是一经 阅读全文
posted @ 2023-04-12 20:43 興華 阅读(229) 评论(0) 推荐(0) 编辑

摘要:1. 案例中首先要厘清表间关系及其表关键字段等信息 2. 厘清第1项内容后,进入MySQL软件进行对应表数据建立 ①首先建立数据库并应用 create database Kdd99; use Kdd99; ②创建各表数据并将对应数据进行上传 创建表 # drop table sale; # 删除表 阅读全文
posted @ 2023-04-12 16:46 興華 阅读(33) 评论(0) 推荐(0) 编辑

摘要:python进行excel处理 1. Excel读取 # 首先导入pandas工具包 import pandas as pd # 读取Excel df = pd.read_excel('./excel_name.xlsx') # 相对路径,./表示当前文件夹上一级 df = pd.read_exce 阅读全文
posted @ 2023-04-04 21:25 興華 阅读(80) 评论(0) 推荐(0) 编辑

摘要:在建立杜邦分析仪时,首先需要厘清各项项目之前的关系以及需要展现的 阅读全文
posted @ 2023-03-30 20:46 興華 阅读(32) 评论(0) 推荐(0) 编辑

摘要: 阅读全文
posted @ 2023-03-22 18:54 興華 阅读(63) 评论(0) 推荐(0) 编辑

点击右上角即可分享
微信分享提示