随笔分类 - Machine Learning
摘要:cross_val_score(model_name, x_samples, y_labels, cv=k) 作用:验证某个模型在某个训练集上的稳定性,输出k个预测精度。 K折交叉验证(k-fold) 把初始训练样本分成k份,其中(k-1)份被用作训练集,剩下一份被用作评估集,这样一共可以对分类器做
阅读全文
摘要:自然语言处理(ML),机器学习(NLP),信息检索(IR)等领域,评估(evaluation)是一个必要的工作,而其评价指标往往有如下几点:准确率(accuracy),精确率(Precision),召回率(Recall)和F1-Measure。 本文将简单介绍其中几个概念。中文中这几个评价指标翻译各
阅读全文
摘要:1 """ 2 执行lda2vec.ipnb中的代码 3 模型LDA 4 功能:训练好后模型数据的可视化 5 """ 6 7 from lda2vec import preprocess, Corpus 8 import matplotlib.pyplot as plt 9 import numpy as np 10 # %matplotlib inl...
阅读全文
摘要:np.argsort(x):返回数据x从小到大的索引值,记住是一个索引值。当你想获取从小到大的数据的时候,用到这个 data[::-1]:对数据data进行倒转 list是通过下标访问的,我们可以使用已经获得的下标获取list里面的数据 快速的将list保存到字典数据中
阅读全文
摘要:昨天训练了性别和年龄预测的模型。给我的启发很大。你的侧重点要着眼于能够适用于工业界的模型,训练耗时少,占用内存小,效率高,支持海量数据分析能力。虽然深度学习很火,但要普遍适用于广大工业界还有一段距离。 1.模型GBDT,XGBoost,LightGBM都是非常不错的模型,需要重点研究,要吃透其中的原
阅读全文
摘要:1 # -*- coding: utf-8 -*- 2 """ 3 Created on Fri Sep 29 11:05:52 2017 4 机器学习之sklearn 5 @author: den 6 """ 7 # 导入数据集 8 from sklearn import datasets 9 # 进行交叉验证 10 from sklearn.cross_validation...
阅读全文
摘要:应导师要求,给新来的师弟师妹讲讲机器学习的一些东西,方便有个大概的结构,本人不才,略写点自己的看法和总结,有错误之处请多多指教。 回顾比赛 最近半年参加的比赛成绩: 比赛感悟,有了成长,更有了坚定的目标,比赛中深刻发现自己学习方面的缺陷,封赛专心学习,重打基础,做更靠谱的方案。 基本过程 具体问题需
阅读全文
摘要:更多技术干活请关注:阿里云云栖社区 - 汇聚阿里技术精粹 作者:Team Machine Learning,这是一个机器学习爱好者团队,他们热衷于建立一个有希望在数据科学/机器学习方面建立事业的有抱负的年轻毕业生和专业人士的环境。 介绍 机器学习很复杂。你可能会遇到一个令你无从下手的数据集,特别是当
阅读全文
摘要:Matlab 代码: 测试主程序: 示意图: 参考自:http://www.voidcn.com/blog/llp1992/article/p-2308490.html
阅读全文