09 2019 档案
摘要:机器学习中的又一个利器,广泛用于Kaggle或类似的数据比赛。 机器学习中的又一个利器,广泛用于Kaggle或类似的数据比赛。 xlearn的优势: 1.通用性好,包括主流的算法(lr, fm, ffm 等),用户不用再切换于不同软件之间 2.性能好,测试 xLearn 可以比 libfm 快13倍
阅读全文
摘要:在数学中,ARG MAX(或ARGMAX)代表最大值,即给定参数的点集,给定表达式的值达到其最大值: 换一种说法, 是f(x)具有最大值M的x的值的集合。例如,如果f(x)是1- | x |,那么它在x = 0时达到其最大值1并且仅在那里, 所以.. 等价地,如果M是f的最大值,那么arg max是
阅读全文
摘要:RandomForest算法(有监督学习),可以根据输入数据,选择最佳特征组合,减少特征冗余;原理:由于随机决策树生成过程采用的Boostrap,所以在一棵树的生成过程并不会使用所有的样本,未使用的样本就叫(Out_of_bag)袋外样本,通过袋外样本,可以评估这个树的准确度,其他子树叶按这个原理评
阅读全文
摘要:import numpy as np from matplotlib import pyplot as plt # 创建线性回归数据集 def create_dataset(): X = 2 * np.random.rand(100, 1) # 结果加上高斯噪声 y = 4 + 3*X + np.r
阅读全文
摘要:1. 超级权限打开cmd.exe 2. pip install --upgrade setuptools 3. pip install -U --ignore-installed wrapt enum34 simplejson netaddr 4. pip install -i https://py
阅读全文
摘要:类别不平衡问题类别不平衡问题,顾名思义,即数据集中存在某一类样本,其数量远多于或远少于其他类样本,从而导致一些机器学习模型失效的问题。例如逻辑回归即不适合处理类别不平衡问题,例如逻辑回归在欺诈检测问题中,因为绝大多数样本都为正常样本,欺诈样本很少,逻辑回归算法会倾向于把大多数样本判定为正常样本,这样
阅读全文
摘要:OpenCV于11月20日发布了OpenCV-3.4.4和OpenCV-4.0.0。这些版本中有很多错误修复和其他更改。发布重点如下: OpenCV现在是C ++ 11库,需要符合C ++ 11标准的编译器。所需的最低CMake版本已提升至3.5.1。 很多来自OpenCV 1.x的C API已被删
阅读全文
摘要:近两个月来接触了Linux系统,在老板的建议下翻了Ubuntu的牌子,我安装的版本是16.04,用习惯之后感觉蛮好的,比Windows要强。好啦,废话不说啦,下面开始说在Ubuntu中安装OpemCV+OpenCV_Contrib。 首先,准备一下开发环境: Ubuntu 16.04 64位 cma
阅读全文
摘要:最近发现使用git clone的速度比较慢,于是找到了办法分享给大家: 思路: git clone特别慢是因为github.global.ssl.fastly.net域名被限制了。 只要找到这个域名对应的ip地址,然后在hosts文件中加上ip–>域名的映射,刷新DNS缓存便可。 实施: 在网站 h
阅读全文
摘要:前面的话 最近决定要好好地学习一下OpenCV,Ubuntu系统上简单地搭建了OpenCV环境,(Windows的搭建方法移步到window10的搭建方法),千里之行始于足下,不积跬步无以至千里,在这里记录一下搭建过程,顺便整理了自动安装的脚本,以备下次环境自动化搭建,有部分依赖可能没有涵盖,有需要
阅读全文
摘要:最近opencv3.4.1发布了,想换个新的试试鲜,于是把配置的过程通过博文的方式记录下来,方便查阅。 本教程原为3.3.0,但经过博主亲测,3.4.0、3.4.1皆适用 1.去官网下载opencv,在本教程中选用的时opencv3.4.1,其他版本的配置方法异曲同工。 下载链接http://ope
阅读全文
摘要:https://www.e-learn.cn/content/python/2198918from sklearn.feature_selection import SelectKBest,f_classif #数据预处理过滤式特征选取SelectKBest模型 def test_SelectKBest(): X=[[1,2,3,4,5], [5,4,3,2,1],...
阅读全文