摘要:
一、什么是attention机制 Attention机制:又称为注意力机制,顾名思义,是一种能让模型对重要信息重点关注并充分学习吸收的技术.通俗的讲就是把注意力集中放在重要的点上,而忽略其他不重要的因素。其中重要程度的判断取决于应用场景,拿个现实生活中的例子,比如1000个人眼中有1000个哈姆雷特 阅读全文
摘要:
nn.ModuleDict 是nn.module的容器,用于包装一组网络层,以索引方式调用网络层。主要方法: clear(): 清空ModuleDictitems(): 返回可迭代的键值对(key-value pairs)keys(): 返回字典的键(key)values(): 返回字典的值(val 阅读全文
摘要:
一、kmeans聚类 import numpy as np import pandas as pd import matplotlib.pyplot as plt import seaborn as sns import re pd.set_option('max_columns', 600) pd 阅读全文
摘要:
来源:https://mp.weixin.qq.com/s/n26qRKimzN9p4Pb5oH_wlw oCPC(optimized CPC)是一种智能自动出价的竞价策略。主要特点如下:A.广告主提供期望的转化价格,由算法帮助广告主自动出价。B.高转化人群高出价,低转化人群低出价,精选优质流量,在 阅读全文
摘要:
来源:https://mp.weixin.qq.com/s/E0k9D9TRWpbRG_gPpIrJbQ OCPC即Optimization CPC,今天我们就来看看它的Optimizaton在哪儿。 在广告模型初探(一)中我们就曾提到过,互联网广告的本质其实就是流量的买卖。是广告主、媒体方以及用户 阅读全文
摘要:
一、推荐中如何定义强化学习的几个元素 方式1: Agent:推荐引擎。 Environment:用户。 Reward:如果一条新闻被点击,计+1,否则为0。一次推荐中10条新闻被点击的新闻个数作为Reward。 State:包含3个部分,分别是用户标签、候选新闻的新闻标签和用户前4屏的点击历史(如果 阅读全文
摘要:
来源:https://www.zhihu.com/question/26408259 问题分析 我们可以通过强化学习(reinforcement learning)来解决小鸟怎么飞这个问题。强化学习中有状态(state)、动作(action)、奖赏(reward)这三个要素。智能体(Agent,指小 阅读全文
摘要:
代码实现参考GitHub:https://github.com/gczr/Q-Learning 阅读全文
摘要:
原文连接:https://mp.weixin.qq.com/s/06ZOgCaW7uWKT5OIMqHyGQ 导读:推荐系统在今天互联网产品和应用中起着举足轻重的地位。一般的推荐系统是基于云端计算中心到边缘 ( 比如手机、平板电脑等 ) 的结构,这其中会由于网络带宽和延迟等导致结果的延迟。边缘的实时 阅读全文
摘要:
常常有人问起来,模型和策略之间到底是个什么关系。其实往往,模型是策略流程中非常重要的一个环节:可以直接根据评分卡分数拒绝掉一部分客户,或着根据分数走不同的审批流程、使用不同的额度策略。 那么问题就在于,这个划分的切点到底应该定在哪里?到底违约概率高到什么程度的客户需要走人工电核?这个问题,可不是等频 阅读全文