计算时代之大数据-分类阅读时代
这里提到了互联网及移动互联网的发展,软件研发的越来越深化,分工会越来越细,同样,互联网庞大的信息资源,哪怕只是新闻,也超出了我们的承受量,从网站门户,过度到新闻客户端就是一个明显的例子。
人类的能力并没有随网络近进化而大幅度的提升,一天24小时也没有改变,我们能做的,就是要把数据也细分。主要关注我们想关注的。忽略大多数不太关心的数据。
这里头,数据抽取是一个大问题。哪些才是有价值的,哪些是我们应该关心的?比如,同样新闻,明天开始限行,这可能是我们都要关心的。忽视了会带来不便。但有家人的小狗走丢了或者是某XXX星又发露PP图了,这类东西我们可能不想让它占据我们的视野。
数据海求生就象学游泳,需要一些方法和技巧,象豆瓣这类网站,就很超前,N年前就看到这一点,在数据越来越庞大的今天,它反而越来越有价值。
同样,IT技术也是,本来IT技术就很难了,再乱七八遭一堆,根本没有时间消化,庞大的无用或价值过低的信息,是我们通往大牛路上最大的障碍,就象是在杂草从生的路上前进。
怎么把有价值的,我们关心的东西分捡出来,哪怕是手工或自动,这是很关键的一个问题。
【推荐】国内首个AI IDE,深度理解中文开发场景,立即下载体验Trae
【推荐】编程新体验,更懂你的AI,立即体验豆包MarsCode编程助手
【推荐】抖音旗下AI助手豆包,你的智能百科全书,全免费不限次数
【推荐】轻量又高性能的 SSH 工具 IShell:AI 加持,快人一步
· 如何编写易于单元测试的代码
· 10年+ .NET Coder 心语,封装的思维:从隐藏、稳定开始理解其本质意义
· .NET Core 中如何实现缓存的预热?
· 从 HTTP 原因短语缺失研究 HTTP/2 和 HTTP/3 的设计差异
· AI与.NET技术实操系列:向量存储与相似性搜索在 .NET 中的实现
· 地球OL攻略 —— 某应届生求职总结
· 周边上新:园子的第一款马克杯温暖上架
· Open-Sora 2.0 重磅开源!
· .NET周刊【3月第1期 2025-03-02】
· [AI/GPT/综述] AI Agent的设计模式综述