Fork me on GitHub
摘要: 一.前述 Linux中正则匹配查找比较常用,所以分享一篇关于正则匹配和Grep结合的文章。 二.匹配规则 匹配操作符: \ 转义字符. 匹配任意单个字符[1249a],[^12],[a-k] 字符序列单字符占位^ 行首$ 行尾\<,\>:\<abc 单词首尾边界| 连接操作符(,) 选择操作符\n 阅读全文
posted @ 2018-01-19 16:32 L先生AI课堂 阅读(1324) 评论(0) 推荐(0) 编辑
摘要: 一.前述 Kmeans算法一般在数据分析前期使用,选取适当的k,将数据分类后,然后分类研究不同聚类下数据的特点。 Kmeans算法是一种无监督的算法。 常用于分组,比如用户偏好。 二.概念及原理 Kmeans原理: 1 随机选取k个中心点 2 遍历所有数据,将每个数据划分到最近的中心点中 3 计算每 阅读全文
posted @ 2018-01-18 01:53 L先生AI课堂 阅读(537) 评论(0) 推荐(0) 编辑
摘要: 一.前述 今天分享一篇关于HBase的一对多和多对多的案例的分析。 二.具体案例 案例一.多对多 人员-角色 人员有多个角色 角色优先级 角色有多个人员 人员 删除添加角色 角色 可以添加删除人员 人员 角色 删除添加 PS:说明,两张表User表和Role表, User表中定义两个列族,第一个列族 阅读全文
posted @ 2018-01-17 21:22 L先生AI课堂 阅读(726) 评论(0) 推荐(0) 编辑
摘要: 一.前述 之前讲解了Nginx的源码安装与加载到系统服务中去,http://www.cnblogs.com/LHWorldBlog/p/8298226.html 今天详细讲解Nginx中的具体配置。 二.具体配置 #工作模式与连接数上限events{#参考事件模型,use [ kqueue | rt 阅读全文
posted @ 2018-01-17 20:19 L先生AI课堂 阅读(568) 评论(0) 推荐(0) 编辑
摘要: 一.前述 Copy过来一段介绍Apache Flume 是一个从可以收集例如日志,事件等数据资源,并将这些数量庞大的数据从各项数据资源中集中起来存储的工具/服务,或者数集中机制。flume具有高可用,分布式,配置工具,其设计的原理也是基于将数据流,如日志数据从各种网站服务器上汇集起来存储到HDFS, 阅读全文
posted @ 2018-01-17 19:48 L先生AI课堂 阅读(3885) 评论(0) 推荐(0) 编辑
摘要: 一.前述 本节主要描述Hive的优化使用,Hive的优化着重强调一个 把Hive SQL 当做Mapreduce程序去优化二.主要优化点 1.Hive运行方式:本地模式集群模式本地模式开启本地模式:set hive.exec.mode.local.auto=true;注意:hive.exec.mod 阅读全文
posted @ 2018-01-17 00:02 L先生AI课堂 阅读(710) 评论(0) 推荐(0) 编辑
摘要: 一.前述 Mapreduce可以自定义Inputforma对象和OutPutformat对象,所以原理上Mapreduce可以和任意输入源结合。 二.步骤 将结果写会到hbase中去。 2.1 Main函数 2.2 Mapper函数(和正常的Mapper没啥区别) 2.3 Reduce函数(主要是把 阅读全文
posted @ 2018-01-16 23:39 L先生AI课堂 阅读(443) 评论(0) 推荐(0) 编辑
摘要: 一.前述 HBase优化能够让我们对调优有一定的理解,当然企业并不是所有的优化全都用,优化还要根据业务具体实施。 二.具体优化 1.表的设计 1.1 预分区 默认情况下,在创建HBase表的时候会自动创建一个region分区,当导入数据的时候,所有的HBase客户端都向这一个region写数据,直到 阅读全文
posted @ 2018-01-16 23:19 L先生AI课堂 阅读(11379) 评论(0) 推荐(0) 编辑
摘要: Nginx安装步骤: 1.依赖 gcc openssl-devel pcre-devel zlib-devel 安装:yum install gcc openssl-devel pcre-devel zlib-devel -y2. 安装Nginx./configure 3. make && make 阅读全文
posted @ 2018-01-16 18:47 L先生AI课堂 阅读(328) 评论(0) 推荐(0) 编辑
摘要: 一.前述。 Hbase shell启动命令窗口,然后再Hbase shell中对应的api命令如下。 二.说明 Hbase shell中删除键是空格+Ctrl键。 三.代码 1.封装所有的API 2.原始Api 解析: 1. String rowkey = pnum + "_" + (Long.MA 阅读全文
posted @ 2018-01-16 18:32 L先生AI课堂 阅读(2206) 评论(0) 推荐(0) 编辑