07 2020 档案
数据分析-机器学习面试题
摘要:1.数据处理时缺失指怎么处理 1)删除样本或删除字段(缺失比例超过80%以上) 2)用中位数、平均值、众数等填充(平均数:数据分布近似于正态分布,中位数:数据分布近似于偏态分布,众数:特征值为离散值) 3)插补:同类均值插补、多重插补、极大似然估计 4)用其它字段构建模型,预测该字段的值,从而填充缺 阅读全文
posted @ 2020-07-28 21:18 ucas_python 阅读(916) 评论(0) 推荐(0)
数据分析面试-数据库
摘要:一.关于数据库内容的考察 sql 本文将从三大块介绍入门SQL需要掌握的语法和知识,分别是最基础的选择(select)和连接(join/union);最常用的函数(distinct/group by/order by等);一些小小的进阶技巧(组内排序、取前百分之多少的值、时间函数)。 一.最基本(选 阅读全文
posted @ 2020-07-01 18:07 ucas_python 阅读(666) 评论(0) 推荐(1)