03 2023 档案
摘要:TGI是英文Target Group Index的缩写,直译为“目标群体指数”。计算方法非常简单: TGI = [目标群体中具有某一特征 的群体所占比例/总体中具有相同特征的群体所占比例]*100 举个简单的例子。我在读大学时,我们专业的男女比为1:3,即女生所占比例为75%。显然,这是一个让其他理
阅读全文
摘要:相同点 insert into 和 insert overwrite 都是往表中插入数据的。 不同点 区别1: insert into :其实是将数据追加到表的末尾,注意:不是覆盖,是追加。 insert overwrite : 其实是将重写表(或分区)中的内容,即将原来的hive表(或分区)中的数
阅读全文
摘要:在机器学习算法中,常会遇到分类特征是离散的,无序的。例如:性别有男、女,城市有北京,上海,深圳等 性别特征: ["男","女"] => 0,1 地区特征: ["北京","上海,"深圳"] => 0,1,2 工作特征: ["演员","厨师","公务员","工程师","律师"] => 0,1,2,3,4
阅读全文
摘要:train_test_split 函数 在机器学习中,我们通常将原始数据按照比例分割为“测试集”和“训练集”,从 sklearn.model_selection 中调用train_test_split 函数 简单用法如下: X_train,X_test, y_train, y_test =sklea
阅读全文