数据分析-机器学习面试题
摘要:1.数据处理时缺失指怎么处理 1)删除样本或删除字段(缺失比例超过80%以上) 2)用中位数、平均值、众数等填充(平均数:数据分布近似于正态分布,中位数:数据分布近似于偏态分布,众数:特征值为离散值) 3)插补:同类均值插补、多重插补、极大似然估计 4)用其它字段构建模型,预测该字段的值,从而填充缺
阅读全文
posted @
2020-07-28 21:18
ucas_python
阅读(916)
推荐(0)
数据分析面试-数据库
摘要:一.关于数据库内容的考察 sql 本文将从三大块介绍入门SQL需要掌握的语法和知识,分别是最基础的选择(select)和连接(join/union);最常用的函数(distinct/group by/order by等);一些小小的进阶技巧(组内排序、取前百分之多少的值、时间函数)。 一.最基本(选
阅读全文
posted @
2020-07-01 18:07
ucas_python
阅读(666)
推荐(1)