计算时代之大数据-分类阅读时代

这里提到了互联网及移动互联网的发展，软件研发的越来越深化，分工会越来越细，同样，互联网庞大的信息资源，哪怕只是新闻，也超出了我们的承受量，从网站门户，过度到新闻客户端就是一个明显的例子。

人类的能力并没有随网络近进化而大幅度的提升，一天24小时也没有改变，我们能做的，就是要把数据也细分。主要关注我们想关注的。忽略大多数不太关心的数据。

这里头，数据抽取是一个大问题。哪些才是有价值的，哪些是我们应该关心的？比如，同样新闻，明天开始限行，这可能是我们都要关心的。忽视了会带来不便。但有家人的小狗走丢了或者是某XXX星又发露PP图了，这类东西我们可能不想让它占据我们的视野。

数据海求生就象学游泳，需要一些方法和技巧，象豆瓣这类网站，就很超前，N年前就看到这一点，在数据越来越庞大的今天，它反而越来越有价值。

同样，IT技术也是，本来IT技术就很难了，再乱七八遭一堆，根本没有时间消化，庞大的无用或价值过低的信息，是我们通往大牛路上最大的障碍，就象是在杂草从生的路上前进。

怎么把有价值的，我们关心的东西分捡出来，哪怕是手工或自动，这是很关键的一个问题。

posted @ 2014-01-14 16:35 人工智能-群513704292 阅读(303) 评论(0) 收藏举报

刷新页面返回顶部

量子计算机