摘要:
贝叶斯公式原理概述 贝叶斯要解决的问题 正向概率 逆向概率 公式推导 - 男女裤子问题 概率 求解 即显示意义就是 欲求解 B 条件下 A 发生的概率, 可以转换成 用 A 条件下 B 发生的概率 和 A , B 各自发生的概率 进行计算 这样可以通过已知的条件组合为想要求解的概率 现实实例 - 拼 阅读全文
摘要:
样本数据 PassengerId,Survived,Pclass,Name,Sex,Age,SibSp,Parch,Ticket,Fare,Cabin,Embarked 1,0,3,"Braund, Mr. Owen Harris",male,22,1,0,A/5 21171,7.25,,S 2,1 阅读全文
摘要:
数据类型 数据数据一般是可以直接加载运算的数据, 一般是整形浮点型等 分类数据则为文本数据, 比如男女, 雌雄等 分类数据描述统计 数值数据描述统计 平均数, 中位数, 众数 平均数 - 求和均分 - 较为适合再数据平稳的样本中 中位数 - 最中间的数值 - 目的查看最中间的数据 众数 - 最多的数 阅读全文
摘要:
链接数据库 点击确定后选择数据库, 然后输入用户名密码, 选择级别选择指定的数据库即可 之后弹出的导航器中即可有可预览的数据 更加推荐使用 再链接数据库的时候高级查询的 sql 中进行 sql 的执行操作, 这样也可以直接加载数据 异常 如果报错这个就点击链接下载之后重启 BI 即可 阅读全文
摘要:
数据库 userinfo , orderinfo 表 两个 userId 彼此对应 题目 解题 不同月份的下单人数 用户在同一个月份会下多个单,这里进行去重 未支付的脏数据去除 统计用户三月份的回购率和复购率 复购率 - 一个月内重复购买的人数占比 先将所有 3月份购买超过一次的进行统计,然后在和全 阅读全文
摘要:
BI 目的 单表的展示有限很多的时候只能体现现象, 仅仅进行监控级别没问题 但是就数据分析而言实在不够用, 大部分的事情需要多表多图展示才可以通过现象深入挖掘诱因 BI 安装 这里使用 microsoft 的 Power BI 因为基础而且免费, 和 microsoft 的环境同套学习成本低 下载软 阅读全文
摘要:
项目背景 杜邦分析法 利用 杜邦分析法完成对一份数据的动态分析 流程图如下 项目源数据 左侧为竖向的数据管理, 右侧为横向的数据管理 横向的数据管理在数据透视的时候会很不方便, 并不推荐 常用叫法左边为 堆叠表, 右侧为 宽表 项目展示 通过点选右侧的月份点选框可以实现左侧图标的动态展示杜邦分析的结 阅读全文
摘要:
美学 配色 画图本身是美学的展示, 出色的配色是必须的 虽然本身美学并不是数据分析的必要, 但是也不能太low 如果做的太丑展示也是很尴尬 配色网站 点击这里 配置 现版本的 excel 中已存在较为丰富的配色方案, 不满意也可以自定义即可 版面设计 / 柱形图 一开始的样式展示, 就是基础的表格数 阅读全文
摘要:
数据可视化之美 案例 案例一 - 上海地铁线路 案例二 - 工资年限薪资变化 案例三 - 交通状态 案例四 - 奥巴马演讲树形词频图 概念 维度, 度量 常见常规图表 散点图 常规散点图 气泡图 单轴散点图 常见案例 折线图 常规折线图 面积图 柱形图 常规柱形图 直方图 其他变种柱形图 左上, 正 阅读全文
摘要:
数据分析工具使用场景 函数 分类 文本清洗函数 FIND - 查找 find 函数查询指定位置的某字符的的位置 快捷键 : 选中后双击右下角的 + 可以快速生成当前一列结果 FIND("查询字符", 查询位置) LEFT - 左截取 left 截取指定位置左侧的指定位数字符 LEFT(截取位置, 截 阅读全文