摘要: http://www.open-open.com/news/view/a22597在互联网这个领域一直有这样的说法:“如果老二无法战胜老大,那么就把老大赖以生存的东西开源吧”。当年Yahoo!与Google还是处在强烈竞 争关系时候,招聘了Doug(Hadoop创始人),把Google老大赖以生存的DFS与Map-Reduce开源了,开始了Hadoop的童年时期。 差不多在2008年的时候,Hadoop才算逐渐成熟。从初创到现在,Hadoop经过了至少7年的积累,现在的Hadoop不仅是当年的老二Yahoo的专用产品了,从Hadoop长长的用户名单中, 可以看到Facebook、Linkedi 阅读全文
posted @ 2014-01-17 22:01 Django's blog 阅读(586) 评论(0) 推荐(0) 编辑
摘要: http://www.open-open.com/lib/view/open1386293551501.html一、介绍Mahout Mahout是Apache下的开源机器学习软件包,目前实现的机器学习算法主要包含有协同过滤/推荐引擎,聚类和分类三 个部分。Mahout从设计开始就旨在建立可扩展的机器学习软件包,用于处理大数据机器学习的问题,当你正在研究的数据量大到不能在一台机器上运行时,就 可以选择使用Mahout,让你的数据在Hadoop集群的进行分析。Mahout某些部分的实现直接创建在Hadoop之上,这就使得其具有进行大数据 处理的能力,也是Mahout最大的优势所在。相比较于Wek 阅读全文
posted @ 2014-01-17 21:56 Django's blog 阅读(613) 评论(0) 推荐(0) 编辑
摘要: 阅读全文
posted @ 2014-01-17 21:46 Django's blog 阅读(176) 评论(0) 推荐(0) 编辑
摘要: 转自http://www.oschina.net/news/15806/20-opensource-host-websites/开源中国社区收录了大量的开源软件,您会发现,其中绝大多数托管在sf.net、GitHub、code.google.com等站点上。其实不错的开源托管站点还真的是不少。笔者为您总结了如下国外知名的开源项目托管网站。托管站点Top20如下:1.SourceForgeSF为大家所熟知,开源项目的大本营,SF托管至少28万个开源项目,一天的下载量超过200万。2.GitHubGitHub托管使用Git版本控制系统的公开和私有项目。 目前该网站托管超过170万存储项目,包括许多 阅读全文
posted @ 2014-01-17 21:44 Django's blog 阅读(774) 评论(0) 推荐(0) 编辑
摘要: 转自:http://blog.csdn.net/linfei2707/article/details/5770091sourceforgehttp://www.sourceforge.netjava.nethttp://www.java.netwww.eclipse.orgwww.opensource.orgLombozhttp://www.objectlearn.com/index.jsp(J2EE plugin for Eclipse)htmlAreahttp://sourceforge.net/projects/itools-htmlarea/(所见即所得的在线HTML编辑器)XmlBu 阅读全文
posted @ 2014-01-17 21:39 Django's blog 阅读(650) 评论(0) 推荐(0) 编辑
摘要: http://www.open-open.com/lib/view/open1377700292339.html阿里阿里的开源项目很多,这也跟@淘宝正明的开源态度密不可分。有很多重量级的项目,例如LVS、Tengine,或者很有实践价值的中间件,例如 MetaQ(分布式消息系统)、dubbo(RPC框架)、cobar(数据库中间件),或者是Java世界的工具,例如druid、fastjson。都说国内Java公司的技术架构大部分来自阿里系,我觉得一方面来自阿里员工,一方面也可以来自阿里的开源项目。地址有几个:http://code.alibabatech.com/wiki/dashboard. 阅读全文
posted @ 2014-01-17 21:26 Django's blog 阅读(4472) 评论(1) 推荐(1) 编辑
摘要: 1.zipzip(s,t):将序列组合为一个元组序列[(s[0],t[0]), (s[1],t[1]),(s[2],t[2]),(s[3],t[3]),...]>>> s = [1,2,3,4,5,6]>>> t = ['a','b','c','d','e','e']>>> zip(s,t)[(1, 'a'), (2, 'b'), (3, 'c'), (4, 'd'), (5, &# 阅读全文
posted @ 2014-01-17 17:20 Django's blog 阅读(332) 评论(0) 推荐(0) 编辑
摘要: 1.对象的身份、类型、值(1)身份:对象在内存中位置的指针,地址值,>>> a = [1,2,3,4,5]>>> id(a)48497328>>> id(a[0])37465112>>> id(a[1])37465100>>> id(a[2])37465088>>> id(a[3])37465076... 阅读全文
posted @ 2014-01-17 12:12 Django's blog 阅读(272) 评论(0) 推荐(0) 编辑