大数据应用
大数据分析两大技术
在科学研究、计算机仿真、互联网应用、电子商务等诸多应用领域,数据量正在以极快的速度增长,为了分析和利用这些庞大的数据资源,必须依赖有效的数据分析技术.传统的关系数据管理技术(并行数据库)经过了将近 40 年的发展,在扩展性方面遇到了巨大的障碍,无法胜任大数据分析的任务;而以 MapReduce (http://baike.baidu.com/link?url=FagomkuutEwTS1VFwafF5WeWdX_To5YM3tTm3fvNyEWxpy_iJN_-h6Tvifc81O4I)为代表的非关系数据管理和分析技术异军突起,以其良好的扩展性、容错性和大规模并行处理的优势,从互联网信息搜索领域开始,进而在数据分析的诸多领域和关系数据管理技术展开了竞争.关系数据管理技术阵营在丧失搜索这个阵地之后,开始考虑自身的局限性,不断借鉴MapReduce 的优秀思想改造自身,而以 MapReduce 为代表的非关系数据管理技术阵营,从关系数据管理技术所积累的宝贵财富中挖掘可以借鉴的技术和方法,不断解决其性能问题.面向大数据的深度分析需求,新的架构模式正在涌现.关系数据管理技术和非关系数据管理技术在不断的竞争中互相取长补短,在新的大数据分析生态系统内找到自己的位置.
“预见未来”是大数据的核心价值
商家对“大数据”的开发应用。他们依靠计算机进行数据处理,根据你的浏览、搜索、购物记录等等,“猜测”出你的喜好,从而帮你选择可能会喜欢、可能会购买的商品。看看“百度”“微信”“淘宝”这些我们工作生活离不开的应用吧:百度数据是需求数据,需要什么搜索什么;腾讯微信反映出的是兴趣和关系数据,而淘宝网数据形成交易数据,如果同时掌握兴趣和关系、需求及交易数据,就能够把一个人的行为搞清楚。同样的道理,各行各业只要数据足够“大”,预见未来似乎也并不难。
以“百度迁徙”为例。1月26日,“百度迁徙”网站正式上线。网站主页的中国地图上,每一个跳跃的点,都是人们出发和到达的目的地。点击任一城市,就会出现过往8小时内这一城市迁出与迁入人次最多的数据。“百度迁徙”就是把手机网民的定位信息汇总成大数据进行分析,从而勾勒出人们的迁徙轨迹。这些信息对分析人口迁移的方向、城镇化进程、春运运输调配等方面有着重要的价值。
很美丽的一张图片
百度迁徙官网:http://qianxi.baidu.com/
落霞与孤鹜齐飞,秋水共长天一色。