计算时代之大数据-分类阅读时代

从语言到库到框架,再到API,再到标记最后到DSL语言

这里提到了互联网及移动互联网的发展,软件研发的越来越深化,分工会越来越细,同样,互联网庞大的信息资源,哪怕只是新闻,也超出了我们的承受量,从网站门户,过度到新闻客户端就是一个明显的例子。

人类的能力并没有随网络近进化而大幅度的提升,一天24小时也没有改变,我们能做的,就是要把数据也细分。主要关注我们想关注的。忽略大多数不太关心的数据。

这里头,数据抽取是一个大问题。哪些才是有价值的,哪些是我们应该关心的?比如,同样新闻,明天开始限行,这可能是我们都要关心的。忽视了会带来不便。但有家人的小狗走丢了或者是某XXX星又发露PP图了,这类东西我们可能不想让它占据我们的视野。

数据海求生就象学游泳,需要一些方法和技巧,象豆瓣这类网站,就很超前,N年前就看到这一点,在数据越来越庞大的今天,它反而越来越有价值。

同样,IT技术也是,本来IT技术就很难了,再乱七八遭一堆,根本没有时间消化,庞大的无用或价值过低的信息,是我们通往大牛路上最大的障碍,就象是在杂草从生的路上前进。

怎么把有价值的,我们关心的东西分捡出来,哪怕是手工或自动,这是很关键的一个问题。

posted @   人工智能-群513704292  阅读(288)  评论(0编辑  收藏  举报
编辑推荐:
· 如何编写易于单元测试的代码
· 10年+ .NET Coder 心语,封装的思维:从隐藏、稳定开始理解其本质意义
· .NET Core 中如何实现缓存的预热?
· 从 HTTP 原因短语缺失研究 HTTP/2 和 HTTP/3 的设计差异
· AI与.NET技术实操系列:向量存储与相似性搜索在 .NET 中的实现
阅读排行:
· 地球OL攻略 —— 某应届生求职总结
· 周边上新:园子的第一款马克杯温暖上架
· Open-Sora 2.0 重磅开源!
· .NET周刊【3月第1期 2025-03-02】
· [AI/GPT/综述] AI Agent的设计模式综述
点击右上角即可分享
微信分享提示