上一页 1 ··· 15 16 17 18 19 20 21 22 23 ··· 39 下一页
  2020年10月10日
摘要: 前言 最近在做数据分析岗面试技巧时有提及到分析思维,之前都没有总结过,现在专门来总结一次。数据分析思维有漏斗思维,分类思维,平衡思维,A/B test等,主要是应聘运营岗时会涉及到。下面就介绍一下漏斗模型 一、漏斗模型 百科给出的解释:营销漏斗模型指的是营销过程中,将非潜在客户逐步变为客户的转化量化 阅读全文
posted @ 2020-10-10 17:31 小小喽啰 阅读(9579) 评论(0) 推荐(2) 编辑
摘要: 前言 本文主要分两部份,第一部分置信区间的定义和应用,第二部分是置信区间的一二型错误 一、置信区间 置信区间是指由样本统计量所构造的总体参数的估计区间。在统计学中,一个概率样本的置信区间(Confidence interval)是对这个样本的某个总体参数的区间估计。置信区间展现的是这个参数的真实值有 阅读全文
posted @ 2020-10-10 16:56 小小喽啰 阅读(4146) 评论(0) 推荐(1) 编辑
  2020年9月25日
摘要: 数据来源 电信用户数据:https://www.datafountain.cn/dataSets/35/details# 1.数据概述与可视化 # 模块 import pandas as pd import numpy as np import matplotlib.pyplot as plt im 阅读全文
posted @ 2020-09-25 15:16 小小喽啰 阅读(273) 评论(0) 推荐(0) 编辑
摘要: df.pop() 可以使用这个来删除某一列(不能是多列),只有一个参数,就是列名,可以是str类型,函数返回的是被删除的列,df直接是删除后的df,不需要我们处理 我们建模时,需要单独保留某个特征,比如y值,我们就可以用y=xx.pop(label)了,很实用。 例子 df = pd.DataFra 阅读全文
posted @ 2020-09-25 14:06 小小喽啰 阅读(3058) 评论(0) 推荐(0) 编辑
  2020年9月24日
摘要: 数据集中共有12个字段,PassengerId:乘客编号,Survived:乘客是否存活,Pclass:乘客所在的船舱等级;Name:乘客姓名,Sex:乘客性别,Age:乘客年龄,SibSp:乘客的兄弟姐妹和配偶数量,Parch:乘客的父母与子女数量,Ticket:票的编号,Fare:票价,Cabi 阅读全文
posted @ 2020-09-24 17:01 小小喽啰 阅读(518) 评论(0) 推荐(0) 编辑
  2020年9月23日
摘要: ML工作流中最困难的部分之一是为模型找到最好的超参数。ML模型的性能与超参数直接相关。超参数调优的越好,得到的模型就越好。调优超参数可能是非常乏味和困难的,更像是一门艺术而不是科学。 超参数 超参数是在建立模型时用于控制算法行为的参数。这些参数不能从常规训练过程中获得。在对模型进行训练之前,需要对它 阅读全文
posted @ 2020-09-23 18:53 小小喽啰 阅读(2241) 评论(0) 推荐(0) 编辑
摘要: 一、np.unique() 查找数组的唯一元素。 返回数组的排序后的唯一元素。除独特元素外,还有三个可选输出: 输入数组的索引,这些索引给出唯一值 重建输入数组的唯一数组的索引 输入数组中每个唯一值出现的次数 numpy.unique(ar,return_index = False,return_i 阅读全文
posted @ 2020-09-23 15:58 小小喽啰 阅读(6185) 评论(0) 推荐(0) 编辑
摘要: pd.select_dtypes 可以根据数据类型选取特征,这对于我们建模时非常有用,下面来看看怎么使用 DataFrame.select_dtypes(include=None, exclude=None) 参数 include, exclude:scalar or list-like,标量或类似 阅读全文
posted @ 2020-09-23 15:18 小小喽啰 阅读(3997) 评论(0) 推荐(2) 编辑
  2020年9月22日
摘要: pd.to_timedelta 将参数转换为timedelta,Timedelta在pandas中是一个表示两个datetime值之间的差(如日,秒和微妙)的类型,2个Datetime数据运算相减得出的结果就是一个Timedelta数据类型 pandas.to_timedelta(arg, unit 阅读全文
posted @ 2020-09-22 18:58 小小喽啰 阅读(6844) 评论(0) 推荐(0) 编辑
摘要: sklearn.preprocessing.PolynomialFeatures 生成多项式和交互特征。生成由度小于或等于指定度的特征的所有多项式组合组成的新特征矩阵。例如,如果输入样本是二维且格式为[a,b],则2阶多项式特征为[1,a,b,a ^ 2,ab,b ^ 2] class sklear 阅读全文
posted @ 2020-09-22 18:28 小小喽啰 阅读(998) 评论(2) 推荐(1) 编辑
上一页 1 ··· 15 16 17 18 19 20 21 22 23 ··· 39 下一页