scikit-learn
fit_transform和transform这两个函数是类sklearn.preprocessing.StandardScaler()的方法,用来标准化训练和测试数据,意思就是StandardScaler类会对数据的每一个特征做单独的centering和scaling。
- 具体操作
对于训练数据,用fit_transform。
对于测试数据,用transform。
fit用来计算mean和variance。
transform用来将所有的特征都用各自的mean和S做一些转换。
对于训练数据,需要计算train_data的mean和S,然后转换,所以需要用fit_transform。
对于测试数据,可以直接用train_data的mean和A,只需要做转换,所以只需要用transform。
- 为什么测试数据不需要计算自己的mean和S?
因为我们想用模型去推断测试数据的表现,而不是让模型去拟合测试数据。
如果测试数据也计算自己的mean和S,那么模型就会过拟合。
- 数据标准化是指:
rescale数据,让他们的均值为0,标准差为1
One such method is fit_transform() and another one is transform(). Both are the methods of class sklearn.preprocessing.StandardScaler() and ****used almost together while scaling or standardizing our training and test data.
【推荐】国内首个AI IDE,深度理解中文开发场景,立即下载体验Trae
【推荐】编程新体验,更懂你的AI,立即体验豆包MarsCode编程助手
【推荐】抖音旗下AI助手豆包,你的智能百科全书,全免费不限次数
【推荐】轻量又高性能的 SSH 工具 IShell:AI 加持,快人一步
· 终于写完轮子一部分:tcp代理 了,记录一下
· 震惊!C++程序真的从main开始吗?99%的程序员都答错了
· 别再用vector<bool>了!Google高级工程师:这可能是STL最大的设计失误
· 单元测试从入门到精通
· 【硬核科普】Trae如何「偷看」你的代码?零基础破解AI编程运行原理