大数据与死数据

大数据与死数据

为什么,在得知贵州还开办了大数据交易中心,也许是全球第一个
会觉得无比别扭??
连续发布了blog《大数据与郑国渠》、《大数据与黑天鹅》...
在blog中,笔者曾经提到:
积累的数据,一个连pm2.5、耕地面积,都是国家机密的政府,再多的数据,缺乏流动与共享,也是死数据,有意义吗?

4月30日,一周后,黑天鹅又一次出现:《中国科学家难以获取高质量的国内数据科学》
http://www.solidot.org/story?sid=43883


大数据是互联网、后资讯时代的产物。
而互联网的核心只有两个字:free(免费)+open(开放)
纽约的大学生,利用市政府的开放数据库,可以轻松制作出全市的犯罪热点分布图
而我们,就连专业科学家,都无法获得一手的数据,更何况商业应用了、BI开发。
也许,贵州的大数据交易中心,改为免费的、开源的数据共享中心,能够有一个华丽转身。


国内政府强推大数据,提升为国家战略的另外两个“潜在”考虑,可能是:
::基于大数据、信息科技的新型“计划经济”,个人对经济不熟悉,但直觉上觉得不靠谱,至少目前没看到有这方面的理论体系,而成熟的理论体系,是项目成功的基本要素。
  有了成熟的理论体系,未必一定成功,没有,绝对是失败
::建立类似1984的社会管理体系,这个更加不靠谱,网络危机公关的经典手法就是,采用大量的关联信息,淹没负面新闻。
   一组(10台)电脑,每天可以发布上亿条信息(包括填写验证码),可以模拟千万级的用户数据。
   (顺便说一句,个人是国内首家4A级网络公关公司的联合创始人之一,服务过150+国际500强,包括微软、奔驰、西门子)
  
   大数据的通道是互联网,数据、信息是一次性消费产品,可以零成本传播、复制,互联网的核心只有两个字:free(免费)+open(开放)
   积累的数据,一个连pm2.5、耕地面积,都是国家机密的政府,再多的数据,缺乏流动与共享,也是死数据,有意义吗?

 

中国科学家难以获取高质量的国内数据科学
http://www.solidot.org/story?sid=43883

上海海事大学的Zheng Wan在《自然》上发表文章称,中国科学家越来越难以获得高质量的国内数据,认为这一情况可能阻碍科研和创新。他说,大部分公共数据被政府部门控制,其中一些加强了对数据的垄断,使得中国研究人员难以获取这些数据。人文科学的研究人员受影响最大,但数据访问的限制正扩大到环境科学和公共健康等领域,原因是数据具有政治敏感性。即使数据公开了,其质量也令人担忧,最明显的一个例子是全国的GDP数据和各省公布的GDP数据之间存在显著差距,国家统计局称数据差异是数据收集方法的不同导致的。在文章最后,Zheng Wan谈论了互联网审查,称Google学术搜索被屏蔽对他的工作影响非常大。

 

posted @ 2015-04-30 08:38  统领  阅读(143)  评论(0编辑  收藏  举报