会员
周边
众包
新闻
博问
闪存
赞助商
所有博客
当前博客
我的博客
我的园子
账号设置
简洁模式
...
退出登录
注册
登录
善良的大猪猪
Powered by
博客园
博客园
|
首页
|
新随笔
|
联系
|
订阅
|
管理
2020年1月8日
网桥的作用
摘要: 学习:站点A给B发送数据,网桥通过察看帧的源地址了解到A在端口1,过滤数据库中加入<A,1>。扩散:网桥并不知道B在何处,因此把帧向所有其它端口(即端口2和3)进行扩散。转发:B收到A发过来的帧之后,可能会进行回应,即B发送数据给A,这个时候网桥察看源地址了解到B在端口2上,加入表项<B,2>,同时
阅读全文
posted @ 2020-01-08 23:40 善良的大猪猪
阅读(597)
评论(0)
推荐(0)
编辑
2019年10月24日
PMML辅助机器学习算法上线
摘要: 在机器学习用于产品的时候,我们经常会遇到跨平台的问题。比如我们用Python基于一系列的机器学习库训练了一个模型,但是有时候其他的产品和项目想把这个模型集成进去,但是这些产品很多只支持某些特定的生产环境比如Java,为了上一个机器学习模型去大动干戈修改环境配置很不划算,此时我们就可以考虑用预测模型标
阅读全文
posted @ 2019-10-24 14:25 善良的大猪猪
阅读(293)
评论(0)
推荐(0)
编辑
支持度、置信度和提升度
摘要: 转自:https://www.jianshu.com/p/dc053deb94f2 购物篮分析 购物篮数据的二元0/1表示 利用关联分析的方法可以发现关联规则或频繁项集。 二元表示 每一行对应一个事务,每列对应一个项,项用二元变量表示 项在事务中出现比不出现更重要,因此项是非对称的的二元变量。 项集
阅读全文
posted @ 2019-10-24 10:45 善良的大猪猪
阅读(1853)
评论(0)
推荐(0)
编辑
2019年10月23日
特征预处理
摘要: 在前面我们分别讨论了特征工程中的特征选择与特征表达,本文我们来讨论特征预处理的相关问题。主要包括特征的归一化和标准化,异常特征样本清洗与样本数据不平衡问题的处理。 1. 特征的标准化和归一化 由于标准化和归一化这两个词经常混用,所以本文不再区别标准化和归一化,而通过具体的标准化和归一化方法来区别具体
阅读全文
posted @ 2019-10-23 22:43 善良的大猪猪
阅读(198)
评论(0)
推荐(0)
编辑
特征表达及处理
摘要: 转自:https://www.cnblogs.com/pinard/p/9061549.html 在特征选择中,讲到了特征选择的一些要点。本篇继续讨论特征工程,重点关注于特征表达部分,即如果对某一个特征的具体表现形式做处理。主要包括缺失值处理,特殊的特征处理比如时间和地理位置处理,离散特征的连续化和
阅读全文
posted @ 2019-10-23 22:13 善良的大猪猪
阅读(211)
评论(0)
推荐(0)
编辑
卡方检验
摘要: 卡方检验,或称x2检验,被誉为二十世纪科学技术所有分支中的20大发明之一,它的发明者卡尔·皮尔逊是一位历史上罕见的百科全书式的学者,研究领域涵盖了生物、历史、宗教、哲学、法律。之前做文本分类项目用过卡方值做特征选择(降维),后来听内部培训,另一个部门说他们有用卡方检验做异常用户的检测,于是就想把卡方
阅读全文
posted @ 2019-10-23 18:03 善良的大猪猪
阅读(3689)
评论(1)
推荐(0)
编辑
特征工程-特征选择
摘要: 转自:https://www.cnblogs.com/pinard/p/9032759.html 1. 特征的来源 在做数据分析的时候,特征的来源一般有两块,一块是业务已经整理好各种特征数据,我们需要去找出适合我们问题需要的特征;另一块是我们从业务特征中自己去寻找高级数据特征。我们就针对这两部分来分
阅读全文
posted @ 2019-10-23 17:36 善良的大猪猪
阅读(263)
评论(0)
推荐(0)
编辑
2019年7月29日
AMBARI部署HADOOP集群(4)
摘要: 通过 Ambari 部署 hadoop 集群 1. 打开 http://192.168.242.181:8080 登陆的用户名/密码是 : admin/admin 2. 点击 “LAUNCH INSTALL WIZARD”,开始创建一个集群 3. 为集群取一个名字 4. 前面我们建了本地的资源库,这
阅读全文
posted @ 2019-07-29 11:00 善良的大猪猪
阅读(754)
评论(0)
推荐(0)
编辑
AMBARI部署HADOOP集群(3)
摘要: 1. 安装ambari-server 2. ambari server 需要一个数据库存储元数据,默认使用的 Postgres 数据库。默认的用户名和密码是: ambari/bigdata 。但是一般情况下,后面还要安装 hive 和 Ranger,也需要一个存元数据的数据库,所以使用一个mysql
阅读全文
posted @ 2019-07-29 10:48 善良的大猪猪
阅读(828)
评论(0)
推荐(0)
编辑
ambari部署Hadoop集群(2)
摘要: 准备本地 repository 1. 下载下面的包 我用的是 CentOS7 的系统,其它系统的下载链接请参考: https://docs.hortonworks.com/HDPDocuments/Ambari-2.7.3.0/bk_ambari-installation/content/hdp_3
阅读全文
posted @ 2019-07-29 10:28 善良的大猪猪
阅读(525)
评论(0)
推荐(0)
编辑
下一页