随笔- 338
文章- 0
评论- 64
阅读-
45万
随笔分类 - 数据分析与数据运营
数据分析能力闭环
摘要:不懂业务,别谈数据 归根结底,是对业务的理解程度有区别。我看过很多小公司的数据分析师,一般是等着产品或者运营来提需求,然后提个数,出个结论,完事了。 “日活下降什么原因?数据都在这里,自己排查去。”而一个优秀的数据分析师,就能基于对使用场景、对用户行为的理解,在海量数据中找到关键的异常点,并通过【问
阅读全文
数据分析所需要的技术栈
摘要:1.数据库方面:MySQL(重要),Redis等 2.python基础语法(必备) 3.(必备)机器学习(决策树,SVM,贝叶斯,K-Means,Logistic Regression,随机森林,PCA等算法基本原理)、数据挖掘(scikit-learn,NLTK等) 4.(偏后端)WEB后端开发技
阅读全文
待学习bi工具
摘要:Metabase 172.16.11.130:3000user: admin@admin.compwd : Admin123***Metabase 的后端是用 Clojure 写的,前端是用 React + Redux 写的单页应用。由于我对 Clojure 几乎一无所知,所以后端架构方面也就不好
阅读全文
数据预处理--数据清洗
摘要:日常数据大部分时间是存在噪声值的, 为了模型能够更好展现效果,往往需要进行噪声处理,即数据预处理 一:数据缺失值处理 准备数据 import pandas as pd import numpy as np from pandas import Series,DataFrame from numpy
阅读全文
数据运营(一)基本讲解概念及运营方式.
摘要:百里想做数据分析. 如下是帆软数据运营官及数据分析一些学到的东西 一:数据分析师方向: 1:业务型: 业务是数据分析的根本,只有透彻了解业务,才能从中分析出问题所在.业务型对分析师的业务理解能力要求非常高。 2:数据研发型:这个发展方向要求你对技术非常熟练,能够通过技术对数据进行分析。 3:算法型:
阅读全文
基于skearn-learn 框架 的线性回归
摘要:skearn-learn 是一个机器学习的库, 可以省略很多自己写的步骤 一:导入包和数据集 import matplotlib.pyplot as plt #导入画图包import numpy as np #数据包from sklearn import linear_model #导入sklear
阅读全文
手写线性回归算法demo
摘要:数据集展示 我们根据该数据集进行测试 一:导入数据集 获取 x 和y的值 import matplotlib.pyplot as plt import numpy as np def loadDataSet(fileName): numFeat = len(open(fileName).readli
阅读全文
数据分析算法--线性回归算法讲解(2)
摘要:1. 基本形式 2. 损失函数 2.1 损失函数 2.1.1 最小二乘法 2.1.2 极大似然估计 2.2 正规方程法 2.2.1 一般形式 2.2.2 矩阵形式 2.3 梯度下降法 2.3.1 梯度下降法的代数方式描述 2.3.2 梯度下降法的矩阵方式描述 2.3.3 梯度下降的算法调优 2.3.
阅读全文
数据监督与非监督
摘要:数据分析的基础知识内容 什么是监督学习 在监督学习中,计算机通过示例学习。它从过去的数据中学习,并将学习的结果应用到当前的数据中,以预测未来的事件。在这种情况下,输入和期望的输出数据都有助于预测未来事件 二:所有监督学习算法本质上都是复杂算法,分为分类或回归模型。 1.回归模型—回归模型用于输出变量
阅读全文
numpy的常用函数以及常规操作
摘要:numpy的常规函数 一:矩阵的常规操作函数 1 :np.arange() 生成向量 demo2 =np.array([1,2,3,4,5,6,7,8,9,10,11,12,13,14,15]) # 一行向量 转化成矩阵形式 print(demo2.shape) b =np.arange(1,16)
阅读全文
数据分析--基础numpy(一)
摘要:一: numpy 结构设定 1:numpy 结构 numpy array 类型数据类型必须为统一类型 1 import numpy as np 2 number1 =np.array([1,2,3,4]) 3 print(number1) 4 number1.dtype 二:numpy 索引取值及切
阅读全文
数据挖掘 ---支持度和置信度的用法
摘要:如果客户买了 xx 物品,那么他可能买YY物品 规则常用的方法,支持度和置信度 支持度是指规则的应验次数 置信度就是应验次数所占的比例 直接上代码 结果: 通过 置信度和支持度即可 知道 当买了什么时候,客户更喜欢在买什么 最后按照置信度排序
阅读全文
pyecharts v1 版本 学习笔记 折线图,面积图
摘要:折线图 折线图 基本demo import pyecharts.options as optsfrom pyecharts.charts import Linec = ( Line() .add_xaxis(["衬衫", "毛衣", "领带", "裤子", "风衣", "高跟鞋", "袜子"]) .
阅读全文
pyecharts v1 版本 学习笔记 柱状图
摘要:柱状图 bar 基本演示例子 默认取消某series 默认不显示B的商品 显示工具箱 bar Y轴formatter (y轴带坐标的) Bar 指定类型 最大值,最小值,平均值显示 bar -markline 指定类型(划横线那种) Bar 可以滑动的直方图 控制
阅读全文
数据分析相关学习 -1 numpy
摘要:前情提要: 数据分析:把一些看似杂乱无章的数据背后的信息提炼出来,总结出所研究 对象的内在规律 数据分析的三剑客: numpy,pandas,matplotlb numpy是python语言的一个扩展程序库,支持大量的维度数组与矩阵的运算 ,此外,也针对数组的运算,提供了大量的数学函数库 一: 创建
阅读全文
数据分析相关的内容
摘要:我们离不开数据分析 数据分析入门学习路线 1.1 统计学基本知识 1.2 机器学习基本算法 1.3 编程语言及工具 数据分析重头戏之数据整理 2.1 理解你的业务数据 2.2 明确各个特征的类型 2.3 找出异常数据 2.4 不得不面对缺失值 2.5 令人头疼的数据不均衡 Python 入门必备知识
阅读全文
利用python 学习数据分析 (学习四)
摘要:内容学习自: Python for Data Analysis, 2nd Edition 就是这本 纯英文学的很累,对不对取决于百度翻译了 前情提要: 各种方法贴: https://www.cnblogs.com/baili-luoyun/p/10250177.html 内容提要:本次内容主要讲的是
阅读全文
numpy 常用方法2
摘要:Python之Numpy基础 一个栗子 >>> import numpy as np >>> a = np.arange(15).reshape(3, 5) >>> a array([[ 0, 1, 2, 3, 4], [ 5, 6, 7, 8, 9], [10, 11, 12, 13, 14]])
阅读全文