随笔分类 - 微软大数据解决方案
摘要:http://www.microsoft.com/en-us/sqlserver/solutions-technologies/business-intelligence/big-data.aspxDemocratize Big DataHDInsight is Microsoft’s 100% Apache compatible Hadoop distribution, supported by Microsoft. HDInsight, available both on Windows Server or as an Windows Azure service, empowers org
阅读全文
摘要:http://www.windowsazure.com/en-us/manage/services/hdinsight/Quick StartVisit these articles first to get started using the HDInsight Service.Tutorial: Getting Started with the Windows Azure HDInsight ServiceTutorial: Using MapReduce with HDInsightTutorial: Using Hive with HDInsightTutorial: Using Pi
阅读全文
摘要:作者: @陈利人 来自 Google 公司简介Dremel 是Google 的“交互式”数据分析系统。可以组建成规模上千的集群,处理PB级别的数据。MapReduce处理一个数据,需要分钟级的时间。作为MapReduce 的发起人,Google开发了Dremel将处理时间缩短到秒级,作为MapReduce的有力补充。Dremel作为Google BigQuery的report引擎,获得了很大的成功。最近Apache计划推出Dremel的开源实现Drill,将Dremel的技术又推到了浪尖 上。Google Dremel设计根据Google公开的论文《Dremel: Interactive A.
阅读全文
摘要:导读:大数据时代的来临也促使NoSQL数据库迅速崛起,但这并不意味着传统关系数据库即将消亡。近日Google研究院就推出被称为F1的新型数据库,F1作为一种混合型数据库融合了BigTable的高扩展性和SQL数据库的可用性和功能性。F1数据库作者共有12人,清单如下:Jeff Shute、Mircea Oancea、Stephan Ellner、Ben Handy、Eric Rollins、Bart Samwel、Radek Vingralek、Chad Whipkey、Xin Chen、Beat Jegerlehner、Kyle Littlefield、Phoenix Tong。现今云计算的从
阅读全文
摘要:在当今的IT界,现代的NoSQL和“NewSQL”处理数据的方式已经超越了传统的关系数据库。传统关系数据库可能永远不会消失——至少不会很快,但其辉煌的日子已经远去。许多新兴的NoSQL数据库的普及,例如MongnDB和Cassandra。这很好的弥补了传统数据库系统的局限性。相对于NoSQL蓬勃发展的情况基于SQL的关系数据库系统确实显得有些死气沉沉。但这是数据库厂商的错,而不是SQL的错。关系数据库长期以来一直作为企业部署的关键组成部分,但现在出现了更好的选择,以适应新的数据结构和现代化硬件系统。如IBM、微软和甲骨文等厂商都将继续使用关系数据库主导其金融交易的核心功能。但是NoSQL数据库
阅读全文
摘要:微盘打包下载:http://vdisk.weibo.com/s/yJ3L7/1366726293大数据革命.pdfMPP NewSQL 数据库集群支撑企业超大规模数据仓库案例介绍.pdfBig Data in Action – 企业如何运用微软 Big Data 的技术具体规划并落实运行.pdf小米hadoop/hbase微实践.pdfHBase近期的发展及实践.pdf简单诉求下的大数据解决之道.pdf基于Hadoop的携程集中式日志及其周边生态系统介绍.pdf百度的下一代离线存储计算系统.pdf主流开源NoSQL及分布式存储的应用与思考.pdf腾讯在线交易平台统一数据层高一致性解决方案.pd
阅读全文
摘要:洞悉大数据_决策大格局_SQL Server 实战技巧系列课程,也算是对微软大数据的战略及具体的产品线和应用场景有一个大体的了解。本着:学习 -> 尝试 -> 应用的思路,在此总结一下加强学习的效果吧。一.迁移SQL Server database应用程序到Windows Azure虚拟机中 没有什么特别特殊的,只是将Windows Azure的VM之中安装SQL Server。二.微软并行数据仓库 Parallel Data Warehouse 系统架构介绍及实战经验分享微软与Greenplum相竞争的产品,侧重点是MPP的并行计算框架。PolyBase: 数据处理的突破性技术(
阅读全文
摘要:在学习微软TechNet“SQL Server 2012 企业信息管理解决方案 – 将可靠传递给每个企业”时,遇到了ETL的问题,找写资料来学习一下,有一个更加全面的了解。================================================================================================文章源地址:http://ruiqun566-163-com.iteye.com/blog/604176ETL工具介绍 1 ETL基本概念 1.1 ETL的定义 ETL分别是“Extract”、“ Transform” 、“Load”.
阅读全文
摘要:前言:最近在研究微软的大数据解决方案,在收听MS TechNet “SQL Server 2012 AlwaysOn HA+DR设计模型、架构及最佳实践” 时,需要一些预备知识,所以在网络上先学习一下了。预备知识:•Windows Server Failover Clustering (WSFC)•SQL Server AlwaysOn Failover Cluster Instances (FCI)•SQL Server AlwaysOn Availability Groups (AG)虽然下面是对SQL Server 2008的描述,我想大体的思想是相同的就先认真看下面的文章吧。=====
阅读全文