凯心宝牙 - 博客园

2016年9月18日

摘要：创建数据库查看hdfs 目录默认情况下 hive数据库存储在 /user/hive/warehouse 目录下show databases 产看数据库再次使用create database demo;创建数据库，抛出异常，创建数据库时建议使用 create database if no 阅读全文

posted @ 2016-09-18 23:51 凯心宝牙阅读(117) 评论(0) 推荐(0) 编辑

2016年3月18日

Django学习系列之Form基础

摘要： Form对与一个网站来说就是一个灵魂，今天我们就来说说Django的Form概述. 本文内容来自官网,互联网及自己实验所得. 表单(forms.py)的定义: #coding:utf-8from django import formsfrom django.forms.extras.widgets 阅读全文

posted @ 2016-03-18 14:24 凯心宝牙阅读(286) 评论(0) 推荐(0) 编辑

django form关于clean及cleaned_data的说明以及4种初始化

摘要： 1.form类的运行顺序是init，clean，validte，save其中clean和validate会在form.is_valid()方法中被先后调用。(这里留有一个疑问，结构完全相同的两个form，但是一个为先验证后clean，另一个先clean后验证。原因不明。)这里https://docs 阅读全文

posted @ 2016-03-18 13:39 凯心宝牙阅读(8717) 评论(0) 推荐(0) 编辑

2016年1月13日

Spark RDD 创建（一）

摘要： spark 官网apihttp://spark.apache.org/docs/1.6.0/programming-guide.html RDD两种创建方式： 1：SparkContext’s parallelize 常用于测试 2：读取外部数据集如本地文件(linux ,...)或HDFS文件阅读全文

posted @ 2016-01-13 23:38 凯心宝牙阅读(1372) 评论(0) 推荐(0) 编辑

2016年1月12日

编译Spark-1.6.0源码

摘要：源码下载地址:https://archive.apache.org/dist/spark/spark-1.6.0/ 下载源码包:spark-1.6.0.tgz 更具官网 http://spark.apache.org/docs/1.6.0/building-spark.html 需安装 jdk1.7 阅读全文

posted @ 2016-01-12 22:32 凯心宝牙阅读(264) 评论(0) 推荐(0) 编辑

2014年11月8日

Strom学习笔记一

摘要： ---恢复内容开始---Storm是个实时的、分布式以及具备高容错的计算系统。同Hadoop一样Storm也可以处理大批量的数据，然而Storm在保证高可靠性的前提下还可以让处理进行的更加实时；也就是说，所有的信息都会被处理。 Storm同样还具备容错和分布计算这些特性，这就让Storm可以扩展到不... 阅读全文

posted @ 2014-11-08 22:41 凯心宝牙阅读(259) 评论(0) 推荐(0) 编辑

2014年6月17日

Hbase笔记——RowKey设计

摘要：一）、什么情况下使用Hbase1）传统数据库无法承载高速插入、大量读取。2）Hbase适合海量，但同时也是简单的操作。3）成熟的数据分析主题，查询模式确立不轻易改变。二）、现实场景1、电商浏览历史问题：传统数据库数据量很大，事情会变得复杂。Orderby消耗很多性能。大量发生又无法分布式处理，顾客需... 阅读全文

posted @ 2014-06-17 12:25 凯心宝牙阅读(4403) 评论(0) 推荐(0) 编辑

2014年5月29日

Hbase物理模型

摘要： Hbase 一种高可靠，面向列，可伸缩，事实读写的分布式数据库。利用HDFS作为其文件存储系统。MapReduce处理数据。Zookeeper分布式协同服务。数据结构Row Key：行健。（唯一标识）唯一检索条件Time Stamp ：时间撮。（版本标识）Column：列族。（建表时确定）Ro... 阅读全文

posted @ 2014-05-29 12:33 凯心宝牙阅读(1091) 评论(0) 推荐(0) 编辑

2014年5月17日

HDFS分布式文件系统设计思想

摘要： HDFS设计目标 1）硬件错误是常态，数据保存需要冗余。 2）数据批量读取，Hadoop擅长数据分析而不是事务处理。 3）大规模数据集。 4）简单一致醒模型，降低系统复杂度，文件一次写入多次读取， 5）“数据就近”原则分配数据节点。 HDFS体系结构 NameNode DataNode Second 阅读全文

posted @ 2014-05-17 22:12 凯心宝牙阅读(648) 评论(0) 推荐(0) 编辑

Hbase 基本命令

摘要：启动Hbase：./start-hbase.sh进入Hbase shell控制台：./hbase shell查看所有表 list查看数据库状态:status查看数据库版本：version建表 create 'tablename ' , 'cf1' , 'cf2' , 'cf3'查看表结构： desc... 阅读全文

posted @ 2014-05-17 09:34 凯心宝牙阅读(217) 评论(0) 推荐(0) 编辑

凯心大宝牙

公告