摘要: 1.基础知识 ER图的实体(entity)即数据模型中的数据对象,例如人、学生、音乐都可以作为一个数据对象,用长方体来表示,每个实体都有自己的实体成员(entity member)或者说实体对象(entity instance),例如学生实体里包括张三、李四等,实体成员(entity member) 阅读全文
posted @ 2020-11-01 11:59 MiQing4in 阅读(987) 评论(0) 推荐(0) 编辑
摘要: 1.数据分析师的书籍 《利用Python进行数据分析》,《深入浅出数据分析》,《谁说菜鸟不会数据分析》 这些书籍是教我们工具的使用,我们需要关注实际业务需求、 2.什么叫懂业务 来几个测试题: 保健品行业--安利:每个月固定清0,直销行业。 街机厅:主要收入是赌博,其他基本上都要亏钱。 主要指标是: 阅读全文
posted @ 2020-10-30 22:22 MiQing4in 阅读(153) 评论(0) 推荐(0) 编辑
摘要: #五大约束 1、主键约束(Primay Key Coustraint) 唯一性,非空性 primary key 2、唯一约束 (Unique Counstraint)唯一性,可以空,但只能有一个 unique 3、检查约束 (Check Counstraint)对该列数据的范围、格式的限制(如:年龄 阅读全文
posted @ 2020-10-29 22:07 MiQing4in 阅读(332) 评论(0) 推荐(0) 编辑
摘要: 基础知识部分: 1、数据流图的定义 数据流图(DFD)是结构化分析方法中使用的工具,它以图形的方式描绘数据在系统中流动和处理的过程,是系统逻辑模型的主要组成部分。 因为它仅仅反映系统必须完毕的逻辑功能。所以它是一种功能模型。 2、数据流图的用法 数据流图采用分层的形式来描写叙述系统数据流向,每一层次 阅读全文
posted @ 2020-10-27 23:30 MiQing4in 阅读(768) 评论(0) 推荐(1) 编辑
摘要: 1.1 对抗验证的简介: 通常情况下,我们一般都会使用交叉验证来作为评估模型的标准,来选择我们最后的模型。但是在一些数据挖掘竞赛中,数据集一般分为训练集合测试集,国内比赛可能根据比赛阶段划分多个测试集,由于数据集采样和分布的原因导致训练集和线上测试集可能存在分布不一致的情况,这时候CV无法准确的评估 阅读全文
posted @ 2020-07-29 15:46 MiQing4in 阅读(6068) 评论(0) 推荐(1) 编辑
摘要: import pandas as pdimport numpy as npimport lightgbm as lgbfrom sklearn.model_selection import StratifiedKFoldtrain_data=pd.read_csv(r'C:\Users\win10\ 阅读全文
posted @ 2020-07-23 17:21 MiQing4in 阅读(9630) 评论(0) 推荐(0) 编辑
摘要: Pandas里三种调用函数应用的方法:(主要函数apply applymap lambda) 1:apply作用于DF的列或行 当想让方程作用在一维的向量上时,可以使用apply来完成, 最常用 2:applymap作用于DF的所有元素 如果想让方程作用于DataFrame中的每一个元素,可以使用a 阅读全文
posted @ 2020-07-23 11:37 MiQing4in 阅读(550) 评论(0) 推荐(0) 编辑