大数据:从开源告诉你身边的IT故事
最近我们Team利用Dream分布式计算平台,做了这样一件事情,将Github的大量数据通过爬虫抓取下来,通过分析后,我们抽取最近一年中部分的开发者和项目信息,得到了如下有趣的信息,故分享之,数据原汁原味,无人工干涉。(感谢Iveely Team 所有成员的付出)
第一份数据:全球IT人才分布
图1 全球IT人才分布图
其中颜色越深,表示聚集的IT人才越多。其实从这一份数据来看,我们都能理解美国、中国、印度、俄罗斯是软件大国,但是我们也发现,南非和巴西表现也 不错。
第二份数据:全球软件城市排行榜
这些城市按照名次依次是:San Francisco、London、Berlin、Paris、New York、Stockholms、Beijing、Bangalore
通过对前8名的统计得出,硅谷地区依然是世界的IT中心,我们不要感觉欧洲IT产业不怎么好,从数据来看,他们的能力依然是非常出色的,北京与世界的差距 依然存在,印度的硅谷与北京的差距并不明显。
第三份数据:中国软件城市排行榜
按照名次,他们依次是:Beijing、Shanghai、Hangzhou、Guangzhou、Shenzhen、Chengdu、Nanjing、Dalian、Xiamen、Qingdao。
这份数据再次证明了,北京上海是中国无法震撼的IT城市,即使是杭州,也有相当大的差距。南京市政府一直努力的中国软件名城,需要很大的努力。
第四份数据:全球软件企业排行榜
我们分析出来了其中7家企业,分别是: Google、Twitter、Microsoft、Yandex、Red Hat、Globo.com、ThoughtWorks。
从这个图来说:谷歌是开源社区的贡献主力,但是名单上也有微软公司,这也再次证明,微软是同样一家致力于开源世界的企业,当然这里肯定发现不了Oracle。所有企业都发现了两个问题:1.投资开源社区可以提升企业综合影响力。2.要达到相同的影响力,投资额度小于广告。
第五份数据:中国软件企业排行榜
你期待这里出现什么样的公司?我不敢瞎编,用数据说话,他们是:TaoBao、Baidu、Tencent、Douban Inc、Alibaba、netease。
这些公司都是国内目前比较活跃的软件公司,但是360奇虎公司是个意外。我们很少关注的网易,最近一年也为开源社区做了不少贡献。
第六份数据:全球IT高校排行榜
这份数据我真的不想拿出来,因为没有中国的高校,我试图让名次更多一点,但是依然没有发现。全球IT高校排行榜名单:Carnegie Mellon University、University of Washington、Stanford University、University of Michigan、Cornell University、Columbia University、University of Cambridge、University of Toronto、University of Waterloo。
数据再次验证了卡内基梅隆是全球IT精英的殿堂。教育是非常重要的一部分,中国要成为软件大国,还需要在教育上努力下功夫。
第七份数据:中国IT高校排行榜
虽然在上一份数据中,我们没有发现中国高校,但是我们还是拿出了中国软件高校排行榜:Tsinghua University、Zhejiang University、Peking University、Sun Yat-Sen University、Nanjing University、Shenzhen University。
清华大学一直是中国IT教育领域最好的高校,很多关于计算机的图书都是清华大学出版的,当然中山大学却有点让人意外。
总结:事实告诉我们,所有的什么软件大国,所有的软实力,都不能只是口号,我们需要实际行动,中国要成为软件大国,甚至是强国,还有很长的路要走。为什么?开源是在韵量新技术,是新技术发展的摇篮!
以上数据仅供参考。