摘要:
总结 数据集的划分:from sklearn.model_selection import train_test_split train_test_split(x,y,test_size,random_state)参数:x:特征数据,y:标签数据,test_size:测试集的比例,random_st 阅读全文
摘要:
总结 特征工程:对样本数据的特征进行处理除去对样本数据影响很大缺失值,重复值,异常值等等的垃圾数据,提高样本数据在模型中对未知数据预测的准确性 特征抽取 特征化:将非数值的数据转化为数值型的数据 字典数据特征化:from sklearn.feature_extraction import DictV 阅读全文
摘要:
总结 人工智能和机器学习的区别:机器学习可以实现人工智能 机器学习概念:机器学习就是利用样本数据进行一系列分析得到一个数据模型。这个模型可以对未知数据进行预测或分类 模型:对数据进行一系列分析后得到的产物,模型,模型存在的意义就是对未知数据进行预测 训练模型:将样本数据进行分析,训练他们,得到训练后 阅读全文