2018 年 2月随笔档案 - ---江北

【数据仓库】——星型模型和雪花模型

摘要：一、概述在多维分析的商业智能解决方案中，根据事实表和维度表的关系，又可将常见的模型分为星型模型和雪花型模型。在设计逻辑型数据的模型的时候，就应考虑数据是按照星型模型还是雪花型模型进行组织。当所有维表都直接连接到“ 事实表”上时，整个图解就像星星一样，故将该模型称为星型模型，星型架构是一种非正规阅读全文

posted @ 2018-02-28 18:26 ---江北阅读(16871) 评论(1) 推荐(0) 编辑

【数据仓库】——数据仓库命名规范

摘要：一、概述数据模型是数据管理的分析工具和交流的有力手段；同时，还能够很好地保证数据的一致性，是实现商务智能（Business Intelligence）的重要基础。因此建立、管理一个企业级的数据模型，应该遵循标准的命名和设计规范。二、命名规范 1.表属性规范表名 ODS层表名前缀为ODS_应用阅读全文

posted @ 2018-02-28 16:40 ---江北阅读(10908) 评论(0) 推荐(2) 编辑

【数据仓库】——数据仓库建模

摘要：一、什么是数据模型数据模型是抽象描述现实世界的一种工具和方法，是通过抽象的实体及实体之间联系的形式，来表示现实世界中事务的相互关系的一种映射。在这里，数据模型表现的抽象的是实体和实体之间的关系，通过对实体和实体之间关系的定义和描述，来表达实际的业务中具体的业务关系。数据仓库模型是数据模型中针对特阅读全文

posted @ 2018-02-28 15:58 ---江北阅读(1233) 评论(0) 推荐(0) 编辑

【数据仓库】——数据仓库概念

摘要：一、简介 1.什么是数据仓库数据仓库（Data Warehouse）是一个面向主题的（Subject Oriented ）、集成的（Integrated）、相对稳定的（Non-Volatile）、反映历史变化（Time Variant）的数据集合，用于支持管理决策和信息的全局共享。 //请熟练记忆阅读全文

posted @ 2018-02-28 14:49 ---江北阅读(1358) 评论(0) 推荐(0) 编辑

大数据入门第十三天——离线综合案例：网站点击流数据分析

摘要：推荐书籍：《网站分析实战——如何以数据驱动决策，提升网站价值》相关随笔：http://blog.csdn.net/u014033218/article/details/76847263 一、网站点击流数据分析项目业务背景 1.什么是点击流数据 1.web访问日志日志示例： 2.点击流数据模型点阅读全文

posted @ 2018-02-27 20:21 ---江北阅读(5228) 评论(0) 推荐(1) 编辑

大数据入门第十二天——sqoop入门

摘要：一、概述 1.sqoop是什么从其官网：http://sqoop.apache.org/ Apache Sqoop(TM) is a tool designed for efficiently transferring bulk data between Apache Hadoop and str 阅读全文

posted @ 2018-02-27 13:59 ---江北阅读(496) 评论(0) 推荐(0) 编辑

【spring】spirng中的常用工具类

摘要：一、概述很多时候，很多工具类其实spring中就已经提供，常用的工具类有：参考：https://www.cnblogs.com/langtianya/p/3875103.html 内置的resouce类型 UrlResource ClassPathResource FileSystemResou 阅读全文

posted @ 2018-02-26 21:19 ---江北阅读(2205) 评论(0) 推荐(0) 编辑

大数据入门第十二天——azkaban入门

摘要：一、概述 1.azkaban是什么通过官方文档：https://azkaban.github.io/ Azkaban is a batch workflow job scheduler created at LinkedIn to run Hadoop jobs. Azkaban resolves 阅读全文

posted @ 2018-02-26 17:28 ---江北阅读(971) 评论(0) 推荐(0) 编辑

大数据入门第十二天——flume入门

摘要：一、概述 1.什么是flume 官网的介绍：http://flume.apache.org/ Flume is a distributed, reliable, and available service for efficiently collecting, aggregating, and mo 阅读全文

posted @ 2018-02-26 14:11 ---江北阅读(429) 评论(0) 推荐(0) 编辑

大数据入门第十一天——hive详解（三）hive函数

摘要：一、hive函数 1.内置运算符与内置函数函数分类：查看函数信息：常用的分析函数之rank() row_number()，参考：https://www.cnblogs.com/wujin/p/6051768.html 常用20个内置函数： https://www.cnblogs.com/kim 阅读全文

posted @ 2018-02-25 15:32 ---江北阅读(914) 评论(0) 推荐(0) 编辑

大数据入门第十一天——hive详解（二）基本操作与分区分桶

摘要：一、基本操作 1.DDL 官网的DDL语法教程：点击查看建表语句 data_type : primitive_type | array_type | map_type | struct_type | union_type -- (Note: Available in Hive 0.7.0 and 阅读全文

posted @ 2018-02-24 20:16 ---江北阅读(3894) 评论(0) 推荐(0) 编辑

大数据入门第十一天——hive详解（一）入门与安装

摘要：一、基本概念 1.什么是hive The Apache Hive ™ data warehouse software facilitates reading, writing, and managing large datasets residing in distributed storage u 阅读全文

posted @ 2018-02-24 14:33 ---江北阅读(1957) 评论(0) 推荐(0) 编辑

Thymeleaf入门（一）——入门与基本概述

摘要：一、概述 1.是什么简单说， Thymeleaf 是一个跟 Velocity、FreeMarker 类似的模板引擎，它可以完全替代 JSP 。 2.feature 1.Thymeleaf 在有网络和无网络的环境下皆可运行，即它可以让美工在浏览器查看页面的静态效果，也可以让程序员在服务器查看带数据的阅读全文

posted @ 2018-02-23 15:38 ---江北阅读(278744) 评论(7) 推荐(26) 编辑

springboot整合Mybatis（一）——入门

摘要：一、概述 1.先导 mybatis入门随笔：http://www.cnblogs.com/jiangbei/p/6884641.html 2.引入依赖 //其他必须的依赖还包括mysql连接，web依赖（web项目），此处贴出完整依赖（有部分依赖例如jpa此处可不选） <?xml version=" 阅读全文

posted @ 2018-02-12 11:27 ---江北阅读(1946) 评论(0) 推荐(0) 编辑

spring-data-jpa快速入门（二）——简单查询

摘要：一、方法名解析 1.引言回顾HelloWorld项目中的dao接口可以看到，这个接口中我们只是声明了方法而没有写实现，但是却是能用的，这便得益于JPA的方法名解析了 2.简单条件查询按照 Spring Data 的规范，查询方法以 find | read | get 开头涉及条件查询时，条件阅读全文

posted @ 2018-02-11 19:26 ---江北阅读(996) 评论(0) 推荐(0) 编辑

spring-data-jpa快速入门（一）——整合阿里Druid

摘要：一、概述官网：https://projects.spring.io/spring-data-jpa/ 1.什么是spring-data-jpa Spring Data JPA, part of the larger Spring Data family, makes it easy to easi 阅读全文

posted @ 2018-02-11 10:37 ---江北阅读(3558) 评论(0) 推荐(0) 编辑

springboot热部署（二）——springboot热部署与发布

摘要：一、实现的方式概述注意以下的热部署方式在IDEA是默认没有打开自动编译的，手动编译需要快捷键（Ctrl+Shift+F9），自动编译的修改配置如下：(注意刷新不要太快，会有1-2秒延迟) File-Settings-Compiler-Build Project automatically 二、sp 阅读全文

posted @ 2018-02-10 18:49 ---江北阅读(100734) 评论(4) 推荐(5) 编辑

springboot热部署（一）——Java热部署与热加载原理

摘要：一、概述在应用运行的时升级软件，无需重新启动的方式有两种，热部署和热加载。对于Java应用程序来说，热部署就是在服务器运行时重新部署项目，——生产环境热加载即在在运行时重新加载class，从而升级应用。——开发环境二、实现原理热加载的实现原理主要依赖java的类加载机制，在实现方式可以概阅读全文

posted @ 2018-02-10 14:43 ---江北阅读(8919) 评论(0) 推荐(0) 编辑

springboot-web进阶（四）——单元测试

摘要：一、概述基础知识，参考：https://www.cnblogs.com/ysw-go/p/5447056.html 二、springboot的单元测试 1.入门测试类最重要的不要忘记类上面的依赖，以及类里面方法上的@Test（底层是jUnit）这样，就可以看到相关结果了： // 为了高大上一点阅读全文

posted @ 2018-02-09 20:52 ---江北阅读(2057) 评论(0) 推荐(0) 编辑

springboot-web进阶（三）——统一异常处理

摘要：补充 springboot中也是一样的可以对结果进行统一格式的包装，这样也就方便了前台的统一接收处理了； 1.结果集包装类 package com.example.demo.bean; /** * 结果包装 * * @author zcc ON 2018/2/9 **/ public class R 阅读全文

posted @ 2018-02-09 18:33 ---江北阅读(2334) 评论(0) 推荐(0) 编辑

springboot-web进阶（二）——AOP统一处理请求

摘要：一、AOP使用示例 AOP的概述在spring篇已经存在，这里不再赘述 1.准备引入依赖 2.编写Aspect类这里需要特别注意类上面的两个注解，别忘记@Componet！ 3.验证发送请求：查看日志：并且也容易看出，这是在它之前执行的，也就验证了这是Before注解！二、AOP表达式与阅读全文

posted @ 2018-02-09 14:50 ---江北阅读(810) 评论(0) 推荐(0) 编辑

springboot-web进阶（一）——表单验证

摘要：一、概述 1.准备先把快速入门篇的结构调整一下，按照自己的喜好或者要求调整： 2.需求基于快速入门篇增加一个女生的需求，禁止添加未成年（18岁以下） 3.实现第一步：在bean的属性上加对应约束注解 package com.example.demo.bean; import javax.per 阅读全文

posted @ 2018-02-09 14:47 ---江北阅读(1006) 评论(0) 推荐(0) 编辑

springboot快速入门（五）——事务管理

摘要：一、入门概念就不再赘述了，由于一般我们是通过service控制事务，这里给出注解式的示例： controller层就可以调用了：还有更多关于隔离级别等的控制：参考：http://blog.didispace.com/springboottransactional/ 阅读全文

posted @ 2018-02-09 11:18 ---江北阅读(607) 评论(0) 推荐(0) 编辑

springboot快速入门（四）——数据库操作

摘要：一、Spring-Data-Jpa的引入先给出官方文档：https://docs.spring.io/spring-data/jpa/docs/current/reference/html/ IBM的相关教程：https://www.ibm.com/developerworks/cn/openso 阅读全文

posted @ 2018-02-08 21:41 ---江北阅读(1324) 评论(0) 推荐(0) 编辑

springboot快速入门（三）——Controller的使用

摘要：一、概述 controller的分类：相关的使用方式和springMVC的类似了，细节不再赘述二、Controller使用 1.使用@controller注解直接使用会报一个错：原因是缺少了模板的渲染，springboot支持的模板如下： Thymeleaf FreeMarker Veloc 阅读全文

posted @ 2018-02-08 19:57 ---江北阅读(14400) 评论(0) 推荐(1) 编辑

springboot快速入门（二）——项目属性配置（日志详解）

摘要：一、概述 application.properties就是springboot的属性配置文件在使用spring boot过程中，可以发现项目中只需要极少的配置就能完成相应的功能，这归功于spring boot中的模块化配置，在pom.xml中依赖的每个Starter都有默认配置，而这些默认配置足以阅读全文

posted @ 2018-02-08 18:25 ---江北阅读(1737) 评论(0) 推荐(0) 编辑

springboot快速入门（一）——HelloWorld搭建

摘要：一、起步 1.先导凡技术必登其官网的原则，官网走一波：https://projects.spring.io/spring-boot/#quick-start 极力推荐一个springboot教程：https://gitee.com/didispace/SpringBoot-Learning 2.s 阅读全文

posted @ 2018-02-07 15:03 ---江北阅读(1234) 评论(0) 推荐(0) 编辑

大数据入门第十天——hadoop高可用HA

摘要：一、HA概述 1.引言正式引入HA机制是从hadoop2.0开始，之前的版本中没有HA机制 2.运行机制实现高可用最关键的是消除单点故障 hadoop-ha严格来说应该分成各个组件的HA机制——HDFS的HA、YARN的HA 详解：通过双namenode消除单点故障双namenode协调工作阅读全文

posted @ 2018-02-07 10:03 ---江北阅读(490) 评论(0) 推荐(0) 编辑

大数据入门第九天——MapReduce详解（六）MR其他补充

摘要：一、自定义in/outputFormat 1.需求现有一些原始日志需要做增强解析处理，流程： 1、从原始日志文件中读取数据 2、根据日志中的一个URL字段到外部知识库中获取信息增强到原始日志 3、如果成功增强，则输出到增强结果目录；如果增强失败，则抽取原始数据中URL字段输出到待爬清单目录阅读全文

posted @ 2018-02-06 14:29 ---江北阅读(651) 评论(0) 推荐(0) 编辑

大数据入门第九天——MapReduce详解（五）mapJoin、GroupingComparator与更多MR实例

摘要：一、数据倾斜分析——mapJoin 1.背景接上一个day的Join算法，我们的解决join的方式是：在reduce端通过pid进行串接，这样的话：例如订单中的小米5卖的比较好（截止博客时间，已经是米7将出的时候了。），这样的话大部分的数据都流向了P0001的这个reduce上，而P0002 的阅读全文

posted @ 2018-02-05 16:25 ---江北阅读(919) 评论(0) 推荐(0) 编辑

【commons】Bean工具类——commons-beanutils之BeanUtils

摘要：一、起步引入依赖：当然，一般可能项目中不会需要单独引入这个依赖，可能其他依赖自动引入了此包，请先检查，避免重复引入！二、开始文档：http://commons.apache.org/proper/commons-beanutils/javadocs/v1.9.3/apidocs/org/ap 阅读全文

posted @ 2018-02-05 14:51 ---江北阅读(2704) 评论(0) 推荐(0) 编辑

大数据入门第八天——MapReduce详解（四）本地模式运行与join实例

摘要：一、本地模式调试MR程序 1.准备参考之前随笔的windows开发说明处：http://www.cnblogs.com/jiangbei/p/8366238.html 2.流程最重要的是设置LocalJobRunner这个参数，这样mapreduce就变成一个线程在跑了！而处理的数据及输出结果阅读全文

posted @ 2018-02-04 13:48 ---江北阅读(760) 评论(0) 推荐(0) 编辑

大数据入门第八天——MapReduce详解（三）MR的shuffer、combiner与Yarn集群分析

摘要：1/mr的combiner 2/mr的排序 3/mr的shuffle 4/mr与yarn 5/mr运行模式 6/mr实现join 7/mr全局图 8/mr的压缩今日提纲一、流量汇总排序的实现 1.需求对日志数据中的上下行流量信息汇总，并输出按照总流量倒序排序的结果 2.分析基本思路：实现自定阅读全文

posted @ 2018-02-02 09:16 ---江北阅读(1103) 评论(0) 推荐(0) 编辑

《大数据原理与应用》——大数据概述

摘要：1.大数据概念关键是4V：海量（数据量打）、快速（处理速度快）、多样（数据多样化）、价值（价值密度低，商业价值高） 2.大数据关键技术两大核心技术：计算模式： mapreduce等的批处理无法完成高效处理（没有秒级响应） stom等的流计算针对的是秒级响应的处理 Hive等的交互式实时响应 3 阅读全文

posted @ 2018-02-01 19:50 ---江北阅读(768) 评论(0) 推荐(0) 编辑

---江北

冰冻三尺，非一日之寒

02 2018 档案

公告

搜索

随笔分类 (476)

随笔档案 (456)

阅读排行榜