使用python计算vintage
摘要:from hinnc,添加了后面的 if __name__ == '__main__' # -*- coding: utf-8 -*- """ Created on Mon Jan 14 18:57:19 2019 @author: hinnc """ import numpy as np impo
阅读全文
posted @
2020-10-31 13:35
小小喽啰
阅读(1990)
推荐(0) 编辑
pandas 的loc布尔索引
摘要:在使用df的loc布尔索引时,其实里面的列可以是原来列表中没有存在的。。。 import pandas as pd import numpy as np boolean=[True,False] gender=['男','女'] color=['green','blue','yellow'] dat
阅读全文
posted @
2020-10-31 13:28
小小喽啰
阅读(540)
推荐(0) 编辑
备忘
摘要:1.SDS决策引擎https://wenku.baidu.com/view/5b519fc458f5f61fb73666bb.html 2.近200篇机器学习&深度学习资料分享(含各种文档,视频,源码等)https://yq.aliyun.com/articles/584854?spm=a2c4e.
阅读全文
posted @
2020-10-14 18:17
小小喽啰
阅读(122)
推荐(0) 编辑
淘宝 反作弊体系结构
摘要:一、淘宝 反作弊体系结构 淘宝反作弊体系结构可以从数据、算法、和系统三个维度来解释 数据:主要是将识别的作弊数据汇总到买家、宝贝、订单和卖家 四个维度并全量提供给了数据平台供各业务方使用,即可用作算法训练样本的特征,也方便系统查询和监控作弊数据的趋势变化情况; 算法:覆盖了包括账号网、交易网、资金网
阅读全文
posted @
2020-10-13 17:02
小小喽啰
阅读(1163)
推荐(0) 编辑
geohash
摘要:geohash基本原理是将地球理解为一个二维平面,将平面递归分解成更小的子块,每个子块在一定经纬度范围内拥有相同的编码,这种方式简单粗暴,可以满足对小规模的数据进行经纬度的检索 目录: 经纬度常识 认识geohash geohash算法 geohash原理 对照表 经纬度常识 经线是纵的,经度是横的
阅读全文
posted @
2020-10-13 16:56
小小喽啰
阅读(881)
推荐(0) 编辑
模型部署
摘要:http://spark.apache.org/docs/1.6.0/mllib-guide.html
阅读全文
posted @
2020-10-13 16:46
小小喽啰
阅读(99)
推荐(0) 编辑
将csv文件转为xlsx文件,解决csv乱码问题
摘要:工作中,我们经常遇到CSV乱码的问题,这个时候我们可以使用notepad++处理,当然我们可以使用python处理,代码入下 #coding=utf-8 import pandas as pd import os df=open('2_wsg_sswl_loan_rejected_tues_fri.
阅读全文
posted @
2020-10-13 12:23
小小喽啰
阅读(1096)
推荐(0) 编辑
AB测试原理及样本量计算的Python实现
摘要:前言 为了对比不同策略的效果,如新策略点击率的提升是否显著,常需要进行A/B测试。但测试是有成本的,样本量小时不能判断出差异是否是由抽样误差引起,样本量太大时如果效果不好则会造成难以挽回的损失。如何科学地选择样本量呢?需要了解A/B测试的统计学原理 一、 A/B测试的统计学原理 (一)大数定律和中心
阅读全文
posted @
2020-10-12 12:25
小小喽啰
阅读(4349)
推荐(1) 编辑
数据分析-A/B test
摘要:一、A/B test AB测试是为产品的界面或流程制作两个(A/B)或多个(A/B/n)版本,在同一时间维度,分别让组成成分相同(相似)的访客群组(目标人群)随机的访问这些版本,收集各群组的用户体验数据和业务数据,最后分析、评估出最好版本,正式采用。 进行AB实验能够有利于优化用户体验,提升漏斗或者
阅读全文
posted @
2020-10-12 10:56
小小喽啰
阅读(1719)
推荐(0) 编辑
数据分析-分类分析
摘要:前言 我们做分析时经常要多人群分类,特别是做用户画像时经常用到,将对象划分为不同部分或者类别,在进一步分析,就能够挖掘事物的本质 一、分类分析 根据指标的性质,分类分析法分为属性指标分组和数量指标分组 1.属性指标分组分析法 按属性指标分组一般较简单,分组指标一旦确定,组数、组名、组与组之间的界限也
阅读全文
posted @
2020-10-12 10:20
小小喽啰
阅读(2518)
推荐(0) 编辑
数据分析-漏斗模型(AARRR模型)
摘要:前言 最近在做数据分析岗面试技巧时有提及到分析思维,之前都没有总结过,现在专门来总结一次。数据分析思维有漏斗思维,分类思维,平衡思维,A/B test等,主要是应聘运营岗时会涉及到。下面就介绍一下漏斗模型 一、漏斗模型 百科给出的解释:营销漏斗模型指的是营销过程中,将非潜在客户逐步变为客户的转化量化
阅读全文
posted @
2020-10-10 17:31
小小喽啰
阅读(10733)
推荐(2) 编辑
置信区间的I型错误和II型错误
摘要:前言 本文主要分两部份,第一部分置信区间的定义和应用,第二部分是置信区间的一二型错误 一、置信区间 置信区间是指由样本统计量所构造的总体参数的估计区间。在统计学中,一个概率样本的置信区间(Confidence interval)是对这个样本的某个总体参数的区间估计。置信区间展现的是这个参数的真实值有
阅读全文
posted @
2020-10-10 16:56
小小喽啰
阅读(4338)
推荐(1) 编辑