数据库 - 随笔分类 - 夏天的森林

关于大型网站技术演进的思考（八）--存储的瓶颈终篇（8）

摘要：在开始本篇主要内容前，我们一起看看下面的几张截图，首先是第一张图，如下图所示：这是一家电商网站的首页，当我们第一次打开这个首页，网站会弹出一个强制性的对话框，让用户选择货物配送的地址，如果是淘宝和京东的话，那么这个选择配货地址的选项是在商品里，如下图是淘宝的选择配送地点：下图是京东选择配... 阅读全文

posted @ 2015-02-08 19:46 夏天的森林阅读(7664) 评论(9) 推荐(21) 编辑

关于大型网站技术演进的思考（七）--存储的瓶颈（7）

摘要：本文开篇提个问题给大家，关系数据库的瓶颈有哪些？我想有些朋友看到这个问题肯定会说出自己平时开发中碰到了一个跟数据库有关的什么什么问题，然后如何解决的等等，这样的答案没问题，但是却没有代表性，如果出现了一个新的存储瓶颈问题，你在那个场景的处理经验可以套用在这个新问题上吗？这个真的很难说。其实不... 阅读全文

posted @ 2015-02-08 13:43 夏天的森林阅读(9115) 评论(15) 推荐(28) 编辑

关于大型网站技术演进的思考（六）--存储的瓶颈（6）

摘要：在讲数据库水平拆分时候，我列出了水平拆分数据库需要解决的两个难题，它们分别是主键的设计问题和单表查询的问题，主键问题前文已经做了比较详细的讲述了，但是第二个问题我没有讲述，今天我将会讲讲如何解决数据表被水平拆分后的单表查询问题。要解决数据表被水平拆分后的单表查询问题，我们首先要回到问题的源头... 阅读全文

posted @ 2015-02-03 23:51 夏天的森林阅读(11215) 评论(23) 推荐(50) 编辑

关于大型网站技术演进的思考（五）--存储的瓶颈（5）

摘要：上文里我遗留了两个问题，一个问题是数据库做了水平拆分以后，如果我们对主键的设计采取一种均匀分布的策略，那么它对于被水平拆分出的表后续的查询操作将有何种影响，第二个问题就是水平拆分的扩容问题。这两个问题在深入下去，本系列就越来越技术化了，可能最终很多朋友读完后还是没有找到解决实际问题的启迪，而且我... 阅读全文

posted @ 2015-02-01 17:57 夏天的森林阅读(10416) 评论(11) 推荐(33) 编辑

关于大型网站技术演进的思考（四）--存储的瓶颈（4）

摘要：如果数据库需要进行水平拆分，这其实是一件很开心的事情，因为它代表公司的业务正在迅猛的增长，对于开发人员而言那就是有不尽的项目可以做，虽然会感觉很忙，但是人过的充实，心里也踏实。数据库水平拆分简单说来就是先将原数据库里的一张表在做垂直拆分出来放置在单独的数据库和单独的表里后更进一步的把本来是一... 阅读全文

posted @ 2015-01-30 18:24 夏天的森林阅读(14035) 评论(14) 推荐(34) 编辑

关于大型网站技术演进的思考（三）--存储的瓶颈（3）

摘要：存储的瓶颈写到现在就要进入到深水区了，如果我们所做的网站已经到了做数据库垂直拆分和水平拆分的阶段，那么此时我们所面临的技术难度的挑战也会大大增强。这里我们先回顾下数据库的垂直拆分和水平拆分的定义：垂直拆分：把一个数据库中不同业务单元的数据分到不同的数据库里。水平拆分：是根据一定的规则... 阅读全文

posted @ 2015-01-27 00:01 夏天的森林阅读(15638) 评论(21) 推荐(63) 编辑

关于大型网站技术演进的思考（二）--存储的瓶颈（2）

摘要：上篇里我讲到某些网站在高并发下会报出503错误，503错误的含义是指网站服务端暂时无法提供服务的含义，503还表达了网站服务端现在有问题但是以后可能会提供正常的服务，对http协议熟悉的人都知道，5开头的响应码表达了服务端出现了问题，在我们开发测试时候最为常见的是500错误，500代表的含义是服... 阅读全文

posted @ 2015-01-21 23:29 夏天的森林阅读(18280) 评论(35) 推荐(90) 编辑

大数据时代的技术hive：hive的数据类型和数据模型

摘要：在上篇文章里，我列举了一个简单的hive操作实例，创建了一张表test，并且向这张表加载了数据，这些操作和关系数据库操作类似，我们常把hive和关系数据库进行比较，也正是因为hive很多知识点和关系数据库类似。关系数据库里有表（table），分区，hive里也有这些东西，这些东西在hive技术里称为hive的数据模型。今天本文介绍hive的数据类型，数据模型以及文件存储格式。这些知识大家可以类比关系数据库的相关知识。首先我要讲讲hive的数据类型。 Hive支持两种数据类型，一类叫原子数据类型，一类叫复杂数据类型。原子数据类型包括数值型、布尔型和字符串类型，具体如下表所示：基... 阅读全文

posted @ 2013-06-03 00:17 夏天的森林阅读(44059) 评论(7) 推荐(32) 编辑

大数据时代的技术hive：hive介绍

摘要：我最近研究了hive的相关技术，有点心得，这里和大家分享下。首先我们要知道hive到底是做什么的。下面这几段文字很好的描述了hive的特性： 1.hive是基于Hadoop的一个数据仓库工具，可以将结构化的数据文件映射为一张数据库表，并提供完整的sql查询功能，可以将sql语句转换为MapReduce任务进行运行。其优点是学习成本低，可以通过类SQL语句快速实现简单的MapReduce统计，不必开发专门的MapReduce应用，十分适合数据仓库的统计分析。 2.Hive是建立在 Hadoop 上的数据仓库基础构架。它提供了一系列的工具，可以用来进行数据提取转化加载（ETL），这是一... 阅读全文

posted @ 2013-06-02 19:22 夏天的森林阅读(157593) 评论(11) 推荐(73) 编辑

夏天的森林

好记性不如烂笔头

随笔分类 - 数据库

公告