程序源宝宝 - 博客园

公告

2019年10月25日

摘要： Java8 stream的使用1、集合对象取某个属性形成集合List<String> knows = examPaperList.stream().map(TestExam::getKnowPoint).collect(Collectors.toList());2、统计上述String的个数形成Ma 阅读全文

posted @ 2019-10-25 17:40 程序源宝宝阅读(240) 评论(0) 推荐(0) 编辑

2019年5月30日

出现 java.math.BigInteger cannot be cast to java.lang.Long解决办法

摘要： java.sql.SQLException: java.lang.ClassCastException: java.math.BigInteger cannot be cast to java.lang.Long at com.mysql.jdbc.SQLError.createSQLExcepti 阅读全文

posted @ 2019-05-30 12:00 程序源宝宝阅读(12009) 评论(0) 推荐(0) 编辑

2018年1月4日

scala与spark配置浅谈

摘要：安装Scala上传安装包，解压到software目录下[hadoop@master01 install]$ tar -zxvf scala-2.11.8.tgz -C /software/配置环境[hadoop@master01 software]$ su -lc "vi /etc/profile" 阅读全文

posted @ 2018-01-04 17:37 程序源宝宝阅读(358) 评论(0) 推荐(0) 编辑

2017年12月27日

HBase后续随笔

摘要： HBase命令行终端：hbase shell F1、表空间管理： 1、查看表空间 hbase(main):002:0> list_namespace 2、查看表空间下有哪些表 hbase(main):003:0> list_namespace_tables 'default' 3、创建表空间 hba 阅读全文

posted @ 2017-12-27 17:59 程序源宝宝阅读(120) 评论(0) 推荐(0) 编辑

HBase环境搭建随笔

摘要： HBase随笔： 1、HBase数据存放在hdfs集群中，是一个大表，写操作使用MapReduce处理，将（增删改）处理结果放入HBase中，读就直接读HBase，HBase的并发量在1000左右，常用的关系型数据库MySql的并发量在300到500之间，原因在于HBase启用了缓存技术.HBase 阅读全文

posted @ 2017-12-27 12:29 程序源宝宝阅读(201) 评论(0) 推荐(0) 编辑

Hive后续应用部分

摘要： Hive应用部分：准备工作：删除bnyw库1、创建员工表：create table if not exists emp(eno int,ename string,eage int,bithday date,sal double,com double,gender string,dno int) ro 阅读全文

posted @ 2017-12-27 08:24 程序源宝宝阅读(160) 评论(0) 推荐(0) 编辑

2017年12月22日

Hive配置及随笔

摘要： 1、Hive简介：解决繁琐的Map和reduce分析，设计，拆解，以及编码，编译过程， 2、Hive架构原理： 3、Hive服务器搭建： A、在客户端安装Hive1.1.2 B、配置Hive环境 [hadoop@CloudDeskTop bin]$ vi hive-config.sh export 阅读全文

posted @ 2017-12-22 17:44 程序源宝宝阅读(711) 评论(0) 推荐(0) 编辑

2017年12月20日

HDFS集群YARN集群高可用配置随笔

摘要：集群HDFS/YARN高可用配置（zookeeper）： [hadoop@master01 hadoop]$ vi core-site.xml配置： <configuration> <property> <name>fs.defaultFS</name> <value>hdfs://ns1</val 阅读全文

posted @ 2017-12-20 17:36 程序源宝宝阅读(218) 评论(0) 推荐(0) 编辑

2017年12月18日

hadoop集群分区及缓存随笔

摘要： 1、分区是必须要经历Shuffle过程的，没有Shuffle过程无法完成分区操作2、分区是通过MapTask输出的key来完成的，默认的分区算法是数组求模法：数组求模法：将Map的输出Key调用hashcode（）函数得到的哈希吗（hashcode），此哈希吗是一个数值类型，将此哈希吗数值直接阅读全文

posted @ 2017-12-18 18:08 程序源宝宝阅读(196) 评论(1) 推荐(0) 编辑

2017年12月15日

MapReducer随笔小记

摘要：小结排序：1、如果只需要对数据进行过滤，筛选只需要编写Mapper类，不需要Reduce类，此时在Driver中要执行下面一条语句 Job。setNumReduceTask(0)；2、如果需要对数据集进行分组（group by）、排序（order by）、表连接（join）、排重（distinct）阅读全文

posted @ 2017-12-15 17:50 程序源宝宝阅读(173) 评论(0) 推荐(0) 编辑