05 2020 档案
摘要:1 A. balls game import math # 1. 从左到有遍历列表元素,发现数据组,第一个元素为正,第二个元素为负 # 判断是否会吃掉还是消除 def judge(one_list): if len(one_list) < 2: # 长度等于1的列表不需要传进来,需要提前判断 # p
阅读全文
摘要:一、question1 1.问题说明 2-9对应九宫格数字键盘的字母 2.输入23 3.输出 ad bd cd ae be ce af bf cf 4.完整代码 if __name__ == "__main__": import itertools dic = {2:['a', 'b', 'c'],
阅读全文
摘要:1.问题描述 Suppose you have a long flowerbed in which some of the plots are planted and some are not. However, flowers cannot be planted in adjacent plots
阅读全文
摘要:计算细节:参见知乎文章“sklearn-TfidfVectorizer彻底说清楚” 1.根据训练集语料库,计算出tfidf值 2.计算出测试语句每个词语的tfidf值(只有当测试语句的词语在训练语料库的dictionary中,测试语句的词语才会计算tfidf值) import jieba from
阅读全文
摘要:1.自定义聚合函数,结合agg使用 2. 同时使用多个聚合函数 3. 指定某一列使用某些聚合函数 4.merge与transform使用 import pandas as pd import numpy as np np.random.seed(1) dict_data = { 'k1': ['a'
阅读全文
摘要:1.AFM模型pytorch实现。 $a_{ij}^{'}=h^{T}
阅读全文
摘要:离散特征信息增益计算 数据来自《.统计学习方法——李航》5.2.1节中贷款申请样本数据表 利用pandas的value_counts(),快速计算 import pandas as pd import numpy as np def ent(data): ''' calculate entropy
阅读全文
摘要:1. $l_{p}^{n}=\boldsymbol{W}_{p}^{n} \odot \boldsymbol{p}=\sum_{i=1}^{N} \sum_{j=1}^{N} \theta_{i}^{n} \theta_{j}^{n}\left\langle\boldsymbol{f}_{i}, \
阅读全文
摘要:1.torch.sum z = torch.arange(40.).reshape(2, 4, 5) print(z) print(torch.sum( z,0)) print(torch.sum( z,1)) print(torch.sum( z,2)) tensor([[[ 0., 1., 2.
阅读全文
摘要:1.多项式回归(Polynomial Regression). "一元多项式回归": 自变量只有一个 ;"多元多项式回归": 自变量有多个。 一元n次多项式: 多元多次多项式(二元二
阅读全文
摘要:主要内容 1.TPR、FPR、precision、recall、accuracy、ROC、AUC概念介绍 2.ROC曲线如何通过TPR、FPR得到 3.用sklearn.metric 如何计算TPR、FPR得到ROC曲线。用sklearn.metric 如何计算AUC 混淆矩阵 真实值:1 真实值:
阅读全文
摘要:前言:主要记录,在推荐系统利用FFM模型,进行CTR预估的时候,离散化特征需要嵌入,field之间的特征交叉是怎么计算的?记录了数据流动的每一个过程。 FMM是在FM的基础上改进的,理论部分未作过多解释。(内容有不足之处,请大家指正批评) 参考:github:pytorch-fm 一、公式: FFM
阅读全文
摘要:本文主要记录: 1. 离散特征如何预处理之后嵌入 2.使用pytorch怎么使用nn.embedding 以推荐系统中:考虑输入样本只有两个特征,用逻辑回归来预测点击率ctr 看图混个眼熟,后面再说明: 一、离散数据预处理 假设一个样本有两个离散特征【职业,省份】,第一个特征种类有10种,第二个特征
阅读全文