摘要: 一:学习大数据集 讲述能够处理海量数据的算法 思考:为什么要使用海量数据集呢?要知道获取高性能的机器学习系统途径是采用低偏差的学习算法,并用大数据进行训练。 低偏差:表明期望输出和真实标记之间误差小,学习算法拟合能力更强 高偏差:表明期望输出和真实标记之间误差大,学习算法拟合能力较差 低方差:表明训 阅读全文
posted @ 2020-05-25 22:33 山上有风景 阅读(429) 评论(0) 推荐(0) 编辑
摘要: 实现协同过滤学习算法 实现协同过滤学习算法,并将其应用于电影评级数据集。这个数据集由1到5的等级组成。数据集有nu = 943个用户,nm = 1682个电影 一:导入数据及可视化 (一)导入数据 data = sio.loadmat("ex8_movies.mat") Y = data['Y'] 阅读全文
posted @ 2020-05-25 11:47 山上有风景 阅读(469) 评论(0) 推荐(0) 编辑