摘要: 网址https://book.douban.com/reading/46607817/ 建立回归器后,需要建立评价回归器拟合效果的指标模型。 平均误差(mean absolute error):这是给定数据集的所有数据点的绝对误差平均值 均方误差(mean squared error):给定数据集的 阅读全文
posted @ 2018-03-29 23:39 歪胡子的日常 阅读(4621) 评论(0) 推荐(0) 编辑
摘要: 最好大学网 2018大学排名 功能描述: 输入:大学排名url链接 输出:大学排名信息的屏幕输出(排名,大学名称,总分) 技术路线:requests库和bs4库 定向爬虫:仅对输入的URL进行爬取,不扩展爬取 步骤: 1、输入url网址,查看源代码,发现信息都在HTML文件中 2、打开http:// 阅读全文
posted @ 2018-03-29 20:56 歪胡子的日常 阅读(3172) 评论(0) 推荐(0) 编辑
摘要: 注:文件中的异常包括描述性数据(特征)、缺失值(NAN)、 在这里的解决方法是借用pandas库 interpolate()使用插值来估计NaN 如果index是数字,可以设置参数method='value' ,如果是时间,可以设置method='time' get_dummies对离散型特征进行o 阅读全文
posted @ 2018-03-29 20:55 歪胡子的日常 阅读(716) 评论(0) 推荐(0) 编辑