05 2018 档案

摘要:git: https://github.com/linyi0604/MachineLearning 数据集被我下载到本地,可以去我的git上拿数据集 XGBoost提升分类器 属于集成学习模型 把成百上千个分类准确率较低的树模型组合起来 不断迭代,每次迭代生成一颗新的树 下面 对泰坦尼克遇难预测使用 阅读全文
posted @ 2018-05-08 16:53 稀里糊涂林老冷 阅读(2293) 评论(0) 推荐(0) 编辑
摘要:git: https://github.com/linyi0604/MachineLearning 阅读全文
posted @ 2018-05-08 11:26 稀里糊涂林老冷 阅读(2432) 评论(0) 推荐(0) 编辑
摘要:git: https://github.com/linyi0604/MachineLearning分别使用词袋法和nltk自然预言处理包提供的文本特征提取 1 from sklearn.feature_extraction.text import CountVectorizer 2 import nltk 3 # nltk.download("punkt") 4 # nltk.downl... 阅读全文
posted @ 2018-05-08 10:24 稀里糊涂林老冷 阅读(3075) 评论(0) 推荐(0) 编辑
摘要:git:https://github.com/linyi0604/MachineLearning 阅读全文
posted @ 2018-05-07 09:21 稀里糊涂林老冷 阅读(2577) 评论(0) 推荐(0) 编辑
摘要:git:https://github.com/linyi0604/MachineLearning 通过比较 经过正则化的模型 泛化能力明显的更好啦 阅读全文
posted @ 2018-05-06 20:16 稀里糊涂林老冷 阅读(3197) 评论(0) 推荐(0) 编辑
摘要:一次线性函数拟合曲线的结果,是欠拟合的情况: 下面进行建立2次线性回归模型进行预测: 二次线性回归模型拟合的曲线: 拟合程度明显比1次线性拟合的要好 下面进行4次线性回归模型: 四次线性模型预测准确率为百分之百, 但是看一下拟合曲线,明显存在不合逻辑的预测曲线, 在样本点之外的情况,可能预测的非常不 阅读全文
posted @ 2018-05-01 09:35 稀里糊涂林老冷 阅读(10500) 评论(2) 推荐(1) 编辑