02 2015 档案

摘要:前言spark与hadoop的比较我就不多说了,除了对硬件的要求稍高,spark应该是完胜hadoop(Map/Reduce)的。storm与spark都可以用于流计算,但storm对应的场景是毫秒级的统计与计算,而spark(stream)对应的是秒级的。这是主要的差别。一般很少有对实时要求那么高... 阅读全文
posted @ 2015-02-13 15:05 kongmeng 阅读(1159) 评论(0) 推荐(0) 编辑
摘要:关于PythonPython是一门解释性的,面向对象的,并具有动态语义的高级编程语言。它高级的内置数据结构,结合其动态类型和动态绑定的特性,使得它在快速应用程序开发(Rapid Application Development)中颇为受欢迎,同时Python还能作为脚本语言或者胶水语言讲现成的组件或者... 阅读全文
posted @ 2015-02-10 21:40 kongmeng 阅读(921) 评论(0) 推荐(1) 编辑
摘要:matplotlib的官方网址:http://matplotlib.org/ 问题 Python Matplotlib画图,在坐标轴、标题显示这五个字符 ⊥ + - ⊺ ⨁,并且保存后也能显示 http://q.cnblogs.com/q/68725/ matplotlib可以嵌入tex代码,画出的 阅读全文
posted @ 2015-02-09 09:25 kongmeng 阅读(1551) 评论(0) 推荐(0) 编辑
摘要:GITHUB, 开源包d3。数据可视化利器。http://ghv.artzub.com/#repo=d3&climit=100&user=mbostock&run知乎精选: http://www.zhihujingxuan.com/18179.html知乎用户的回答(1259票)】:强烈推荐 Pyt... 阅读全文
posted @ 2015-02-06 15:52 kongmeng 阅读(3275) 评论(0) 推荐(0) 编辑
摘要:本文原名“Don't use Hadoop when your data isn't that big ”,出自有着多年从业经验的数据科学家Chris Stucchio,纽约大学柯朗研究所博士后,搞过高频交易平台,当过创业公司的CTO,更习惯称自己为统计学者。对了,他现在自己创业,提供数据分析、推荐... 阅读全文
posted @ 2015-02-04 09:32 kongmeng 阅读(889) 评论(0) 推荐(1) 编辑

点击右上角即可分享
微信分享提示