数据密集型 大数据

科学研究四大范式:

第一范式:经验科学

人类最早的科学研究,主要以记录和描述自然现象为特征,又称为“实验科学”

经验科学是“理论科学”的对称,指偏重于经验事实的描述和明确具体的实用性的科学,一般较少抽象的理论概括性。在研究方法上,以归纳为主,带有较多盲目性的观测和实验。一般科学的早期阶段属经验科学,生物、化学尤其如此。经验科学的主要研究模型是:科学实验。典型范例包括:伽利略的物理学、动力学。

第二范式:理论科学

如果假说能借由大量可重现的观察与实验而验证,并为众多科学家认定,这项假说可被称为理论。理论科学偏重理论总结和理性概括,强调较高普遍的理论认识而非直接实用意义的科学。在研究方法上,以演绎法为主,不局限于描述经验事实。 

理论科学的主要研究模型是:数学模型。 典型范例包括:数学中的集合论、图论、数论和概率论;物理学中的相对论、弦理论、圈量子引力理论;地理学中的大陆漂移学说、板块构造学说;气象学中的全球暖化理论;经济学中的微观经济学、宏观经济学以及博弈论;计算机科学中的算法信息论、计算机理论。

第三范式:计算科学

利用电子计算机对科学实验进行模拟仿真的模式。是一个与数据模型构建、定量分析方法以及利用计算机来分析和解决科学问题相关的研究领域。在实际应用中,计算科学主要用于对各个科学学科中的问题进行计算机模拟和其他形式的计算。典型的问题域包括:数值模拟,重建和理解已知事件(如地震、海啸和其他自然灾害),或预测未来或未被观测到的情况(如天气、亚原子粒子的行为);模型拟合与数据分析,调整模型或利用观察来解方程(如石油勘探地球物理学、计算语言学,基于图的网络模型,复杂网络等);计算和数学优化,最优化已知方案(如工艺和制造过程、运筹学等)。

计算科学的主要研究模型是:计算机仿真和模拟。典型范例包括:热力学和分子问题、信号系统,以及传统的人工智能等。

第四范式:数据密集型科学

第三范式,是先提出可能的理论,再搜集数据,然后通过计算来验证。而基于大数据的第四范式,则是先有了大量的已知数据,然后通过计算得出之前未知的理论。大数据时代最大的转变,就是放弃对因果关系的渴求,取而代之关注相关关系。也就是说,只要知道“是什么”,而不需要知道“为什么”。关联关系是大数据的本质特征之一。

计算科学的主要研究模型是:数据挖掘和机器学习,特别是机器学习。典型范例包括几乎所有的大数据实践场景,以及基于大数据的人工智能。特别是当前火热的新一代人工智能研究。我们在过去认为非常难以解决的智能问题,会因为大数据的使用而迎刃而解,比如围棋。同时,大数据还会彻底改变未来的商业模式,很多传统的行业都将采用数据驱动的智能技术实现升级换代,同时改变原有的商业模式。大数据和机器智能对于未来社会的影响是全方位的,对整个社会带来巨大的冲击,尤其是在智能革命的初期。

 

posted @ 2018-07-20 21:06  spring7  阅读(1235)  评论(0编辑  收藏  举报