随笔 - 384  文章 - 0  评论 - 35  阅读 - 142万
10 2020 档案
使用python计算vintage
摘要:from hinnc,添加了后面的 if __name__ == '__main__' # -*- coding: utf-8 -*- """ Created on Mon Jan 14 18:57:19 2019 @author: hinnc """ import numpy as np impo 阅读全文
posted @ 2020-10-31 13:35 小小喽啰 阅读(1990) 评论(0) 推荐(0) 编辑
pandas 的loc布尔索引
摘要:在使用df的loc布尔索引时,其实里面的列可以是原来列表中没有存在的。。。 import pandas as pd import numpy as np boolean=[True,False] gender=['男','女'] color=['green','blue','yellow'] dat 阅读全文
posted @ 2020-10-31 13:28 小小喽啰 阅读(540) 评论(0) 推荐(0) 编辑
备忘
摘要:1.SDS决策引擎https://wenku.baidu.com/view/5b519fc458f5f61fb73666bb.html 2.近200篇机器学习&深度学习资料分享(含各种文档,视频,源码等)https://yq.aliyun.com/articles/584854?spm=a2c4e. 阅读全文
posted @ 2020-10-14 18:17 小小喽啰 阅读(122) 评论(0) 推荐(0) 编辑
淘宝 反作弊体系结构
摘要:一、淘宝 反作弊体系结构 淘宝反作弊体系结构可以从数据、算法、和系统三个维度来解释 数据:主要是将识别的作弊数据汇总到买家、宝贝、订单和卖家 四个维度并全量提供给了数据平台供各业务方使用,即可用作算法训练样本的特征,也方便系统查询和监控作弊数据的趋势变化情况; 算法:覆盖了包括账号网、交易网、资金网 阅读全文
posted @ 2020-10-13 17:02 小小喽啰 阅读(1163) 评论(0) 推荐(0) 编辑
geohash
摘要:geohash基本原理是将地球理解为一个二维平面,将平面递归分解成更小的子块,每个子块在一定经纬度范围内拥有相同的编码,这种方式简单粗暴,可以满足对小规模的数据进行经纬度的检索 目录: 经纬度常识 认识geohash geohash算法 geohash原理 对照表 经纬度常识 经线是纵的,经度是横的 阅读全文
posted @ 2020-10-13 16:56 小小喽啰 阅读(881) 评论(0) 推荐(0) 编辑
模型部署
摘要:http://spark.apache.org/docs/1.6.0/mllib-guide.html 阅读全文
posted @ 2020-10-13 16:46 小小喽啰 阅读(99) 评论(0) 推荐(0) 编辑
将csv文件转为xlsx文件,解决csv乱码问题
摘要:工作中,我们经常遇到CSV乱码的问题,这个时候我们可以使用notepad++处理,当然我们可以使用python处理,代码入下 #coding=utf-8 import pandas as pd import os df=open('2_wsg_sswl_loan_rejected_tues_fri. 阅读全文
posted @ 2020-10-13 12:23 小小喽啰 阅读(1096) 评论(0) 推荐(0) 编辑
AB测试原理及样本量计算的Python实现
摘要:前言 为了对比不同策略的效果,如新策略点击率的提升是否显著,常需要进行A/B测试。但测试是有成本的,样本量小时不能判断出差异是否是由抽样误差引起,样本量太大时如果效果不好则会造成难以挽回的损失。如何科学地选择样本量呢?需要了解A/B测试的统计学原理 一、 A/B测试的统计学原理 (一)大数定律和中心 阅读全文
posted @ 2020-10-12 12:25 小小喽啰 阅读(4349) 评论(0) 推荐(1) 编辑
数据分析-A/B test
摘要:一、A/B test AB测试是为产品的界面或流程制作两个(A/B)或多个(A/B/n)版本,在同一时间维度,分别让组成成分相同(相似)的访客群组(目标人群)随机的访问这些版本,收集各群组的用户体验数据和业务数据,最后分析、评估出最好版本,正式采用。 进行AB实验能够有利于优化用户体验,提升漏斗或者 阅读全文
posted @ 2020-10-12 10:56 小小喽啰 阅读(1719) 评论(0) 推荐(0) 编辑
数据分析-分类分析
摘要:前言 我们做分析时经常要多人群分类,特别是做用户画像时经常用到,将对象划分为不同部分或者类别,在进一步分析,就能够挖掘事物的本质 一、分类分析 根据指标的性质,分类分析法分为属性指标分组和数量指标分组 1.属性指标分组分析法 按属性指标分组一般较简单,分组指标一旦确定,组数、组名、组与组之间的界限也 阅读全文
posted @ 2020-10-12 10:20 小小喽啰 阅读(2518) 评论(0) 推荐(0) 编辑
数据分析-漏斗模型(AARRR模型)
摘要:前言 最近在做数据分析岗面试技巧时有提及到分析思维,之前都没有总结过,现在专门来总结一次。数据分析思维有漏斗思维,分类思维,平衡思维,A/B test等,主要是应聘运营岗时会涉及到。下面就介绍一下漏斗模型 一、漏斗模型 百科给出的解释:营销漏斗模型指的是营销过程中,将非潜在客户逐步变为客户的转化量化 阅读全文
posted @ 2020-10-10 17:31 小小喽啰 阅读(10733) 评论(0) 推荐(2) 编辑
置信区间的I型错误和II型错误
摘要:前言 本文主要分两部份,第一部分置信区间的定义和应用,第二部分是置信区间的一二型错误 一、置信区间 置信区间是指由样本统计量所构造的总体参数的估计区间。在统计学中,一个概率样本的置信区间(Confidence interval)是对这个样本的某个总体参数的区间估计。置信区间展现的是这个参数的真实值有 阅读全文
posted @ 2020-10-10 16:56 小小喽啰 阅读(4338) 评论(0) 推荐(1) 编辑

< 2025年3月 >
23 24 25 26 27 28 1
2 3 4 5 6 7 8
9 10 11 12 13 14 15
16 17 18 19 20 21 22
23 24 25 26 27 28 29
30 31 1 2 3 4 5

点击右上角即可分享
微信分享提示