摘要: # demo示例import cv2 import numpy as np from PIL import Image # 计算平均哈希值 def ahash(image): # 缩放为8*8 image = cv2.resize(image, (8, 8), interpolation=cv2.I 阅读全文
posted @ 2023-04-25 17:11 阿井井w 阅读(231) 评论(0) 推荐(0) 编辑
摘要: 一、数学原理 PCA的数学原理参见这条博客,写的通俗易懂:http://blog.codinglabs.org/articles/pca-tutorial.html 其中几个重点步骤如下: 二、除了降维之外的综合评价打分体系应用 PCA主要被用于降维,但是总是记得之前数学建模的时候可以被用来作为综合 阅读全文
posted @ 2023-04-11 11:11 阿井井w 阅读(237) 评论(0) 推荐(0) 编辑
摘要: TGI是英文Target Group Index的缩写,直译为“目标群体指数”。计算方法非常简单: TGI = [目标群体中具有某一特征 的群体所占比例/总体中具有相同特征的群体所占比例]*100 举个简单的例子。我在读大学时,我们专业的男女比为1:3,即女生所占比例为75%。显然,这是一个让其他理 阅读全文
posted @ 2023-03-30 11:48 阿井井w 阅读(206) 评论(0) 推荐(0) 编辑
摘要: 相同点 insert into 和 insert overwrite 都是往表中插入数据的。 不同点 区别1: insert into :其实是将数据追加到表的末尾,注意:不是覆盖,是追加。 insert overwrite : 其实是将重写表(或分区)中的内容,即将原来的hive表(或分区)中的数 阅读全文
posted @ 2023-03-09 17:26 阿井井w 阅读(808) 评论(0) 推荐(0) 编辑
摘要: 在机器学习算法中,常会遇到分类特征是离散的,无序的。例如:性别有男、女,城市有北京,上海,深圳等 性别特征: ["男","女"] => 0,1 地区特征: ["北京","上海,"深圳"] => 0,1,2 工作特征: ["演员","厨师","公务员","工程师","律师"] => 0,1,2,3,4 阅读全文
posted @ 2023-03-08 20:35 阿井井w 阅读(202) 评论(0) 推荐(0) 编辑
摘要: train_test_split 函数 在机器学习中,我们通常将原始数据按照比例分割为“测试集”和“训练集”,从 sklearn.model_selection 中调用train_test_split 函数 简单用法如下: X_train,X_test, y_train, y_test =sklea 阅读全文
posted @ 2023-03-06 22:54 阿井井w 阅读(40) 评论(0) 推荐(0) 编辑
摘要: 恢复内容开始 建表: drop table if exists t_user_attendence; CREATE TABLE `t_user_attendence` ( `id` INT(11) NOT NULL AUTO_INCREMENT, `fuser_id` varchar(11) def 阅读全文
posted @ 2021-09-15 17:24 阿井井w 阅读(317) 评论(0) 推荐(0) 编辑
摘要: 例题:如何将逗号分隔的一行数据变成多行 例如表格如下: 需要转换的结果如下: 转换的SQL语句如下: select substring_index(substring_index(a.userIds,',',b.help_topic_id+1),',',-1) as id, substring_in 阅读全文
posted @ 2021-08-12 19:23 阿井井w 阅读(1847) 评论(0) 推荐(0) 编辑
摘要: 预热: 我们先从几个物理概念入手理解什么是流量,存量,增量 (1)存量:系统在某一时点时的所保有的数量; (2)流量:是指在某一段时间内流入/流出系统的数量 (3)增量:是指在某一段时间内系统中保有数量的变化 (4)增量 = 流入量--流出量 (5)本期期末存量 = 上期期末存量+本期内增量 全量表 阅读全文
posted @ 2021-07-09 14:30 阿井井w 阅读(788) 评论(0) 推荐(0) 编辑
摘要: 在提高用户留存,特别是长期留存的过程中,对于沉默用户的唤醒和流失用户的召回将变得十分重要,因为这是在提高留存的上限值。 唤醒是针对沉默用户,召回是针对流失用户 一、沉默用户的唤醒 沉默用户一般是指在近期一段时间未活跃但还没有卸载流失的用户,这种用户处于一个即将流失的状态。 沉默用户形成的原因也是因为 阅读全文
posted @ 2021-07-08 20:37 阿井井w 阅读(674) 评论(0) 推荐(0) 编辑