随笔分类 - 案例
摘要:经常有一些需要做id打通的场景,比如用户id打通等, 问题抽象是每条数据都可以解析出一个或多个kv pair:(id_type,id),然后需要将某一个kv pair匹配的多条数据进行merge; 比如: data1: Array(('type1', 'id1'), ('type2', 'id2')
阅读全文
摘要:一 场景分析 定位分析广泛应用,比如室外基站定位,室内蓝牙beacon定位,室内wifi探针定位等,实现方式是三点定位 Trilateration 理想情况 这种理想情况要求3个基站‘同时’采集‘准确’的距离信息, 实际情况 3个基站采集数据的时间是分开的; 采集数据的距离不准确; 解决方法是: 增
阅读全文
摘要:一 场景分析 用户行为分析应用的场景很多,像线上网站访问统计,线下客流分析(比如图像人脸识别、wifi探针等),比较核心的指标有几个: PV | UV | SD | SC 指标说明: PV(Page View):网站浏览量或者商场门店的访问量UV(Unique Visitor):独立访客数,即去重后
阅读全文
摘要:问题 有一个发送100w短信的任务,如何尽量缩短发送时间,同时在中途因为各种原因任务挂掉时,比如发送完50w时任务挂掉,重启任务之后只发送剩余50w短信? 这是一个比较通用的问题,容易想到的办法是: 方案一 步骤 使用数据库来存放所有数据(比如100w条待发送短信),同时设置status,未处理是0
阅读全文
摘要:背景 假设一个应用有很多的用户位置信息基础数据,抽象数据格式如下: user_id date time address province city district latitude longitude user1 2018-01-01 12:00:00 北京市朝阳区朝阳大悦城 北京 北京 朝阳 1
阅读全文