随笔分类 -  机器学习

摘要:特征工程:特征抽象、特征衍生 特征抽象 这一步是针对有序和无序的文本分类型特征,采用不同的方法进行处理,将其类别属性数值化。 多值有序特征的属性数值映射,这步也包含了降维处理(对于高维类别变量),把类别抽象成模型可以识别的特征值。有序特征的映射,使用的方法是先构建一个映射字典mapping,再用pa 阅读全文
posted @ 2019-02-22 19:21 吊车尾88 阅读(2503) 评论(0) 推荐(0)
摘要:数据科学领域从业者普遍认为:数据和特征决定了机器学习效果的上限,而模型和算法只是逼近这个上限。而特征工程就是逼近这个上限的极速器。特征工程处理后的特征越好,模型的可选择性和灵活性越强,同时也降低了模型的复杂度,提升模型的效果,执行的效率及模型的可解释性。特征工程的最终目的就是提升模型的性能。 特征工 阅读全文
posted @ 2019-02-22 19:15 吊车尾88 阅读(1411) 评论(0) 推荐(0)
摘要:机器学习是目前人工智能最令人激动的研究方向之一。我们可能更关注机器学习算法的实现细节,沉浸于机器学习所需要的数学功底,但对于机器学习从业者来说,如何更好更快速的实现一个机器学习项目更值得关注。 正如吴恩达在《机器学习》这门课中所说,他将花费更多的时间来教授机器学习、人工智能的最佳实践以及如何让它们工 阅读全文
posted @ 2019-02-19 14:30 吊车尾88 阅读(602) 评论(0) 推荐(0)
摘要:在拿到一份数据准备做挖掘建模之前,首先需要进行初步的数据探索性分析(你愿意花十分钟系统了解数据分析方法吗?),对数据探索性分析之后要先进行一系列的数据预处理步骤。因为拿到的原始数据存在不完整、不一致、有异常的数据,而这些“错误”数据会严重影响到数据挖掘建模的执行效率甚至导致挖掘结果出现偏差,因此首先 阅读全文
posted @ 2019-01-31 09:29 吊车尾88 阅读(5369) 评论(0) 推荐(0)