随笔档案「2016年11月9日」：机器学习算法的随机数据生成 ... - 刘建平Pinard

2016年11月9日

摘要：在学习机器学习算法的过程中，我们经常需要数据来验证算法，调试参数。但是找到一组十分合适某种特定算法类型的数据样本却不那么容易。还好numpy, scikit-learn都提供了随机数据生成的功能，我们可以自己生成适合某一种模型的数据，用随机数据来做清洗，归一化，转换，然后选择模型与算法做拟合和预测。阅读全文

posted @ 2016-11-09 22:03 刘建平Pinard 阅读(35692) 评论(11) 推荐(20)

刘建平Pinard

十五年码农，对数学统计学，数据挖掘，机器学习，大数据平台，大数据平台应用开发，大数据可视化感兴趣。

公告