随笔分类 -  案例

摘要:经常有一些需要做id打通的场景,比如用户id打通等, 问题抽象是每条数据都可以解析出一个或多个kv pair:(id_type,id),然后需要将某一个kv pair匹配的多条数据进行merge; 比如: data1: Array(('type1', 'id1'), ('type2', 'id2') 阅读全文
posted @ 2019-06-07 01:18 匠人先生 阅读(536) 评论(0) 推荐(0) 编辑
摘要:一 场景分析 定位分析广泛应用,比如室外基站定位,室内蓝牙beacon定位,室内wifi探针定位等,实现方式是三点定位 Trilateration 理想情况 这种理想情况要求3个基站‘同时’采集‘准确’的距离信息, 实际情况 3个基站采集数据的时间是分开的; 采集数据的距离不准确; 解决方法是: 增 阅读全文
posted @ 2018-12-29 13:26 匠人先生 阅读(549) 评论(0) 推荐(0) 编辑
摘要:一 场景分析 用户行为分析应用的场景很多,像线上网站访问统计,线下客流分析(比如图像人脸识别、wifi探针等),比较核心的指标有几个: PV | UV | SD | SC 指标说明: PV(Page View):网站浏览量或者商场门店的访问量UV(Unique Visitor):独立访客数,即去重后 阅读全文
posted @ 2018-12-29 12:18 匠人先生 阅读(917) 评论(0) 推荐(1) 编辑
摘要:问题 有一个发送100w短信的任务,如何尽量缩短发送时间,同时在中途因为各种原因任务挂掉时,比如发送完50w时任务挂掉,重启任务之后只发送剩余50w短信? 这是一个比较通用的问题,容易想到的办法是: 方案一 步骤 使用数据库来存放所有数据(比如100w条待发送短信),同时设置status,未处理是0 阅读全文
posted @ 2018-10-20 10:21 匠人先生 阅读(1403) 评论(0) 推荐(1) 编辑
摘要:背景 假设一个应用有很多的用户位置信息基础数据,抽象数据格式如下: user_id date time address province city district latitude longitude user1 2018-01-01 12:00:00 北京市朝阳区朝阳大悦城 北京 北京 朝阳 1 阅读全文
posted @ 2018-10-17 17:45 匠人先生 阅读(846) 评论(0) 推荐(0) 编辑

点击右上角即可分享
微信分享提示