摘要: 缺失值: 比赛提供的数据,发现有些单元格是null或空的 缺失太多:例如调查人口信息,发现“年龄”这一项缺失了40%,就直接把该项指标删除 最简单处理:均值、众数插补 定量数据,例如关于一群人的身高、年龄等数据,用整体的均值来补缺失 定性数据,例如关于一群人的性别、文化程度:某些事件调查的满意度,用 阅读全文
posted @ 2023-11-28 13:54 Enid_Lin 阅读(10) 评论(0) 推荐(0) 编辑
摘要: ​ 查数据平台: 优先在知网、谷歌学术等平台搜索 国家统计局 最全面,月度季度年度,各地区各部门各行业,包罗万象 https://data.stats.gov.cn/ 其他国家部门网站大多都有数据分页,如果需要可另行查找 awesome-public-datasets GitHub上的一个项目,包舍 阅读全文
posted @ 2023-11-28 13:30 Enid_Lin 阅读(9) 评论(0) 推荐(0) 编辑
摘要: 知网: 先看知网的硕博士论文 硕博士论文会对研究的问题有详细的背景和基础知识介绍,可帮助我们快速理解题目(学位论文) 如果搜索结果较多,可以按照“被引”排序 高级检索: 例如:想了解神经网络在信贷策略中的应用,想找一些相关的硕博论文 进入高级检索界面,“+”和“_”可以自定义增加和减少检索字段 主题 阅读全文
posted @ 2023-11-28 13:22 Enid_Lin 阅读(15) 评论(0) 推荐(0) 编辑