腾讯用户画像——如何为QQ画像和代理IP画像
腾讯用户画像
画像,实质
上就是给账号、设备等打标签。
用户画像 = 打标签
我们这里主要从安全
的角度动身
来打标签,比如
IP画像,我们会标注IP是不是代理IP,这些对我们做战略
是有辅佐
的。
以QQ的画像为例,比如
,一个QQ只登录IM、不登录其他腾讯的业务、不聊天、频繁的加好友、被好友删除、QQ空间要么没开通、要么开通了QQ空间但是评论多但回复少,这种号码我们普通
会标注QQ养号(色情、营销),相似
的我们也会给QQ打上其他标签。
标签的类别和明细,需求
做风控的人自己
去设定,比如
:天文
位置,按省份标志
。性别,安男女标志
。其他细致规则以此规律自己
去设定。
我们看看腾讯的IP画像,沉淀的逻辑如下图:
普通
的业务都有针对IP的频率、次数限制的战略
,那么黑产为了对立
,必然会大量采用代理IP来绕过限制。
既然代理IP的辨认
如此重要,那我们就以代理IP为例来谈下腾讯辨认
代理IP的过程。
辨认
一个IP是不是代理IP,技术不外乎就是如下四种:
- 反向探测技术:扫描IP是不是开通了80,8080等代理效劳
器经常开通的端口,显然一个普通的用户IP不太可能开通如上的端口。 - HTTP头部的X_Forwarded_For:开通了HTTP代理的IP能够
经过
此法来辨认是不是代理IP;假定
带有XFF信息,该IP是代理IP无疑。
- Keep-alive报文:假定
带有Proxy-Connection的Keep-alive报文,该IP毫无疑问是代理IP。
- 查看IP上端口:假定
一个IP有的端口大于10000,那么该IP大多也存在问题,普通的家庭IP开这么大的端口简直
是不可能的。
以上代理IP检测的办法
简直
都是公开的,但是盲目
去扫描全网的IP,被拦截不说,效率也是一个很大的问题。
因而
,我们的除了应用
网络爬虫爬取代理IP外,还应用
如下办法
来加快代理IP的搜集
:经过
业务建模,搜集
歹意
IP(黑产运用
代理IP的可能性比较
大)然后再经过
协议扫描的方式来判别
这些IP是不是代理IP。每天腾讯都能发现千万级别的歹意
IP,其中大部分
还是代理IP。
【推荐】国内首个AI IDE,深度理解中文开发场景,立即下载体验Trae
【推荐】编程新体验,更懂你的AI,立即体验豆包MarsCode编程助手
【推荐】抖音旗下AI助手豆包,你的智能百科全书,全免费不限次数
【推荐】轻量又高性能的 SSH 工具 IShell:AI 加持,快人一步
· 记一次.NET内存居高不下排查解决与启示
· 探究高空视频全景AR技术的实现原理
· 理解Rust引用及其生命周期标识(上)
· 浏览器原生「磁吸」效果!Anchor Positioning 锚点定位神器解析
· 没有源码,如何修改代码逻辑?
· 全程不用写代码,我用AI程序员写了一个飞机大战
· MongoDB 8.0这个新功能碉堡了,比商业数据库还牛
· 记一次.NET内存居高不下排查解决与启示
· 白话解读 Dapr 1.15:你的「微服务管家」又秀新绝活了
· DeepSeek 开源周回顾「GitHub 热点速览」
2018-07-20 RDP协议暴力破解