随笔分类 - 数据分析学习
摘要:基础操作 1.修改列名 data.columns=["columns1","columns2","columns3"] 2.找出空值所在行 data[data['column1'].isnull()] #或者 result=data[data.isnull().T.any()] 注意isnull()
阅读全文
摘要:一、思维业务作业 天善学院的数据分析框架 思考: 1.任何一个公司都是以盈利为目的,这里天善作为一个线上学习平台,核心应该是用户,以用户学习付费课程而盈利 2.以用户为核心,就涉及了用户生命周期,适用于AARRR框架 下面是基于AARRR框架画出来的天善学院的数据分析框架: 二、Excel作业 此作
阅读全文
摘要:python的应用场景 重复性的东西编写脚本 和对于大数据量的操作 数据搭建的环境 不建议自己在网上找下载,建议下载anaconda,可在清华镜像里面下载anaconda,下载安装之后可在桌面上找到程序image.png jupyer Notebook 为本次学习的常用项目,可进行可视化界面操作,分
阅读全文
摘要:当拿到一份数据的时候,首先会怎么做? 描述性统计学,概率推断统计。 描述性统计学 数值数据:计算 分类数据:不能进行计算,例如,男1 女0 代表一个类别 数值数据和分类数据可以进行互相转换 一般描述统计的方式方法: 1.分类数据的描述性统计:单纯计数就可以 2.数据描述统计: 3.统计度量:平均数
阅读全文
摘要:首先,先了解一下数据库的基本概念要点: 数据库是数据存储的集合,表示数据结构化的信息 列存储表中的信息 行存储表的明细 主键是表中的唯一标识 主键不具备业务意义 在实际操作中,对表的主键不做强制性要求,但是建议设立 主键必须唯一 每行必须有一个主键,不可为空 主键的值不可被修改 主键值被删除后不可重
阅读全文
摘要:美丽的图表,应该是有用的图表 对于数据可视化,大多数人下意识是要好看,下意识的去追求美感,觉得高大尚。其实,美丽的图表应该是有用的图表。 数据可视化的目的是让数据更高效,让读者更高效的进行阅读,而不是自己使用。好的可视化能突出背后的规律,突出重要的因素,最后才是美观。 故 设计图标要明确目的性 【图
阅读全文
摘要:Excel常用于敏捷,快速,需要短时间相应的场景下是非常便捷的数据处理工具。 相对于语言类例如python和R等则用于常规的,规律的场景中应用,便于形成日常规则统计分析。 对于学习的路径:Excel函数 SQL函数 python 必知必会内容:保证使用版本是2013+;培养好的数据表格习惯;主动性的
阅读全文
摘要:一,业务掌握的重要性 很多分析数出的结论得不到业务部门的认可或者得出的解决方案无法落地实现,原因是因为对业务了解匮乏。唯有了解业务,才能建立起业务数据模型,建立起数据分析的体系。 二,经典的业务分析指标将解 (课程截图) 架构化+公式化+业务化=指标 指标的5要素: 1. 核心指标 2. 好的指标应
阅读全文
摘要:一,前言 思维缺失 造成“不知道,不确定“(问题发生没?问题在哪里?为什么?不确定对不对?不确定执行结果?不知道老板是否满意给不给加薪?。。。。) 要拥有三种核心思维: 1. 结构化 2. 公式化 3. 业务化 数据分析思维7大技巧:1.象限法 2.多维法 3.假设法 4.指数法 5.二八法则 6.
阅读全文
摘要:第一周 "数据分析师思维" 第二周 "业务分析" 第三周 "Excel分析" 第四周 "数据可视化" 第五周 "MySQL数据库" 第六周 "统计学" 第七周 "Python" 第八周 "三大作业"
阅读全文
摘要:第一章 准备工作 1.1 What Is This Book About(这本书是关于什么的) 1.2 Why Python for Data Analysis?(为什么使用Python做数据分析) 1.3 Essential Python Libraries(一些重要的Python库) 1.4 I
阅读全文
摘要:2.3 Python语言基础 1 语言语义(Language Semantics) 缩进,而不是括号 Python使用空格(tabs or spaces)来组织代码结构,而不是像R,C++,Java那样用括号。 建议使用四个空格来作为默认的缩进,设置tab键为四个空格 另外可以用分号隔开多个语句:
阅读全文
摘要:2.2 IPython基础 1 Running the IPython Shell (运行IPython Shell) 可以通过命令行启动IPython,就像启动标准的Python解释器一样,直接在terminal中键入ipython,回车即可。因为这里我用的是Jupyter Notebook,默认
阅读全文
摘要:2.1 The Python Interpreter(Python解释器) Python是一门解释性语言。Python的解释器一次只能运行一个命令。标准的Python解释器环境可以用通过输入python进入(在终端输入python后,就能进入解释器): 是提示符(prompt),告诉你可以输入指令。
阅读全文
摘要:1.6 Navigating This Book(本书导航) 如果之前没有接触过Python,那么你应该在第2章和第3章多花一些时间。这两章介绍了Python语言的特性和IPython shell以及Jupyter notebooks。这些东西是本书的基本知识。如果已经有了相关经验,可以直接跳过这些
阅读全文
摘要:1.5 Community and Conferences(社区和讨论组)+ 私货 下面是一些和科学计算,数据处理相关的Python社群和讨论组,如果有什么问题可以进行提问: pydata: A Google Group list for questions related to Python fo
阅读全文
摘要:1.4 Installation and Setup(安装和设置) 这里我们用Anaconda发行版作为Python的使用环境,推荐安装Python3.6,本书就是用Python3.6代码写成的。(译者:我使用的也是Anaconda,Python版本是3.5,与3.6没有任何使用上的差别) 译者:针
阅读全文
摘要:1.3 Essential Python Libraries(一些重要的Python库) 如果不了解Python的数据生态,以及本书中即将用到的一些库,这里会做一个简单的介绍: Numpy 这里就不过多介绍了,下面给出一些链接可以参考。这个库太重要了,Python之所以能在科学计算上独领风骚很大程度
阅读全文
摘要:1.2 Why Python for Data Analysis?(为什么使用Python做数据分析) 这节我就不进行过多介绍了,Python近几年的发展势头是有目共睹的,尤其是在科学计算,数据处理,AI方面,否则大家也不会来看这本书了。 使用Python的一些优点 1. Python是一门胶水语言
阅读全文
摘要:CHAPTER 1 Preliminaries(预备知识) 1.1 What Is This Book About?(这本书是关于什么的) 这本书关心的是如何用Python对数据进行处理和清洗等操作。本书的目的是作为一个指南,讲解使用Python语言和它的一些处理数据的库和工具,这能让我们成为一个有
阅读全文