2020年10月13日
摘要: 一、淘宝 反作弊体系结构 淘宝反作弊体系结构可以从数据、算法、和系统三个维度来解释 数据:主要是将识别的作弊数据汇总到买家、宝贝、订单和卖家 四个维度并全量提供给了数据平台供各业务方使用,即可用作算法训练样本的特征,也方便系统查询和监控作弊数据的趋势变化情况; 算法:覆盖了包括账号网、交易网、资金网 阅读全文
posted @ 2020-10-13 17:02 小小喽啰 阅读(1063) 评论(0) 推荐(0) 编辑
摘要: geohash基本原理是将地球理解为一个二维平面,将平面递归分解成更小的子块,每个子块在一定经纬度范围内拥有相同的编码,这种方式简单粗暴,可以满足对小规模的数据进行经纬度的检索 目录: 经纬度常识 认识geohash geohash算法 geohash原理 对照表 经纬度常识 经线是纵的,经度是横的 阅读全文
posted @ 2020-10-13 16:56 小小喽啰 阅读(788) 评论(0) 推荐(0) 编辑
摘要: http://spark.apache.org/docs/1.6.0/mllib-guide.html 阅读全文
posted @ 2020-10-13 16:46 小小喽啰 阅读(97) 评论(0) 推荐(0) 编辑
摘要: 工作中,我们经常遇到CSV乱码的问题,这个时候我们可以使用notepad++处理,当然我们可以使用python处理,代码入下 #coding=utf-8 import pandas as pd import os df=open('2_wsg_sswl_loan_rejected_tues_fri. 阅读全文
posted @ 2020-10-13 12:23 小小喽啰 阅读(1057) 评论(0) 推荐(0) 编辑