摘要:
https://mp.weixin.qq.com/s/2XRgJr-ydxHA3JxAZ_5HeA 图算法在风控业务的实践 直播行业中有很多业务风控问题,比如说批量注册、刷热度、垃圾信息以及薅羊毛等。图兴起以来,目前用得很广泛的一个场景便是业务风控。 图视角进行业务风控的优势是: 图可以描述黑产团伙 阅读全文
摘要:
一、词袋模型 维度=|词典|; 稀疏向量 假设词典里有7个单词【我们,去,爬山,今天,你们,昨天,运动】 每个单词的表示: 我们:[1,0,0,0,0,0,0] 爬山:[0,0,1,0,0,0,0] 运动:[0,0,1,0,0,0,1] 句子的表示: 我们今天去爬山:[1,1,1,1,0,0,0] 阅读全文
摘要:
之前有段时间关注过图嵌入相关算法,后面又停止关注了,今天偶然看到一篇文章关于图在金融交易场景下的应用,想着那就花时间好好看下吧。 论文链接如下:https://arxiv.org/pdf/1907.07225.pdf 第一部分 概要 金融交易可以看做是异构图中,交易实体之间的边。在金融场景中,这样的 阅读全文
摘要:
API: 广义的API(Application Programming Interface)是指应用程序编程接口,用来提供预定义的方法和函数,调用者无需访问源码和理解内部原理便可实现相应功能。而当前通常指通过HTTP协议传输的web service技术。API设计的目的是为了让程序可读,应当遵从简单 阅读全文
摘要:
一直觉得遗传算法高大上,然后都不明觉厉,决定还是要学习下这个优化算法。 遗传算法主要是模拟我们高中学的染色体变异、染色体交叉等过程,然后通过优胜劣汰获得最优解。 遗传算法中,一个基本单位为“个体”,一个种群(系统)中拥有好多个体。每个个体携带两个内容:染色体与适应度。以羊群举例 整个牧场 -> 一个 阅读全文
摘要:
本文为根据风控课程总结 个人信贷产品的信用评分 商业银行三大风险流动性风险、市场风险(利率、信用)和操作风险,其他(欺诈风险) 信用风险:在合约到期日不完全履约 信用风险重要参数:PD(违约概率)、LGD(违约条件下的损失率)、EAD(违约风险下的敞口暴露)、RWA(风险权重资产)、EL(期望损失) 阅读全文
摘要:
一、客户画像 客户画像应用:精准营销(精准预测、个性化推荐、联合营销);风险管控(高风险用户识别、异常用户识别、高可疑交易识别);运营优化(快速决策、产品组合优化、舆情分析、服务升级);业务创新(批量获客、跨界融合、整合资源与产业升级) 用用户画像的方法圈定我们的用户。行为偏好对客户的特质影响最大。 阅读全文
摘要:
转载 https://zhuanlan.zhihu.com/p/49271699 首发于深度学习前沿笔记 写文章 从Word Embedding到Bert模型—自然语言处理中的预训练技术发展史 张俊林 你所不知道的事 179 人赞了该文章 Bert最近很火,应该是最近最火爆的AI进展,网上的评价很高 阅读全文
摘要:
#英文预处理 词共现矩阵的构建 https://github.com/urgedata/pythondata/blob/master/Text%20Analytics/ericbrown.ipynb #中文预处理 预处理(去特殊符号、去停用词、分词) 把词转成index(word to index) 阅读全文