统计学认识
统计学认识
总论: 统计学是在资料分析的基础上,研究测定、收集、整理、归纳和分析反映数据资料,以便给出正确消息的科学。这一门学科自17世纪中叶产生并逐步发展起来,它广泛地应用在各门学科,从自然科学、社会科学到人文学科,甚至被用于工商业及政府的情报决策。随着大数据时代来临,统计的面貌也逐渐改变,与信息、计算等领域密切结合,是数据科学中的重要主轴之一。譬如自一组数据中,可以摘要并且描述这份数据的集中和离散情形,这个用法称作为描述统计学。另外,观察者以数据的形态,创建出一个用以解释其随机性和不确定性的数学模型,以之来推论研究中的步骤及总体,这种用法被称做推论统计学。这两种用法都可以被称作为应用统计学。数理统计学则是讨论背后的理论基础的学科。
统计可以推测趋势和规律,说明自然和人文现象。
很多人认为统计学是一种科学的数学分支,是关于收集、分析、解释、陈述数据的科学。另一些人认为它是数学的一个分支,因为统计学是关于收集解释数据的。由于它基于观测、重视应用,统计学常被看作是一门独特的数学科学,而不是一个数学分支。很多统计学都不是数学的:如确保所收集来的数据能得出有效的结论;将数据编码、存档以使得信息得以保存,可以在国际上进行比对;汇报结果、总结数据,以便统计员可以明白它们的意思;采取必要措施,保护数据来源对象的隐私。
统计学家通过专门的试验设计和调查样本来提升数据质量。统计学自身也为数据的概率模型提供了预测工具。统计学在其他学术科目上得到了广泛的应用,如自然科学、社会科学、政府、商业等。统计顾问可以帮助没有入户调查经验组织与公司进行问卷研究。
总结叙述收集来的数据被称之为描述统计学。这在进行实验研究信息交流中十分有用。另外,从数据的分布上也可以得出观测上的随机性和不确定性。
将资料中的数据模型化,计算它的概率并且做出对于总体体的推论被称之为推论统计学。推论是科学进步的重要因素,因为它可能从随机变量中得出数据的结论。推论统计学将命题进行更深入的研究,将结果进行检测。这些都是科学方式的一部分。描述统计学和对新数据的分析更倾向于提供更多的信息,逼近命题所述的真理。
“应用统计学”包括描述统计学和推论统计学中的应用成分。理论统计学则注重统计推论背后的逻辑证明,以及数理统计学。数理统计学不但包括推导估测推论法的概率分布,还包括了计算统计和试验设计。
统计学与概率论联系紧密,并常以后者为理论基础。简单地讲,两者不同点在于概率论从总体体中推导出样本的概率。统计推论则正好相反——从小的样本中得出大的总体体的信息。---维基百科
统计学是一门既古老又崭新的科学。说它古老,是因为它已有 300 年的历史,它走过了人类历史的农业经济时代、工业经济时代,又走进了正在到来的知识经济时代。说它崭新,因为它虽然已产生了 300 年,但仍在快速发展。今天,它拥有了更多更新的统计方法和手段,有了更多的研究对象和更广泛的应用领域,显示出更加重要的作用和更广阔的发展前景。
一、18-19 世纪——统计学的创立和发展
德国的斯勒兹曾说过:“统计是动态的历史,历史是静态的统计。” 可见统计学的产生与发展是和生产的发展、社会的进步紧密相联的。
(一)统计学的创立时期
统计学的萌芽产生在欧洲。17 世纪中叶至 18 世纪中叶是统计学的创立时期。在这一时期,统计学理论初步形成了一定的学术派别,主要有国势学派和政治算术学派。
-
国势学派
国势学派又称记述学派,产生于 17 世纪的德国。由于该学派主要以文字记述国家的显著事项,故称记述学派。其主要代表人物是海尔曼 · 康令和阿亨华尔。康令第一个在德国黑尔姆斯太特大学以 “国势学” 为题讲授政治活动家应具备的知识。阿亨华尔在哥廷根大学开设 “国家学” 课程,其主要著作是《近代欧洲各国国势学纲要》,书中讲述 “一国或多数国家的显著事项”,主要用对比分析的方法研究了解国家组织、领土、人口、资源财富和国情国力,比较了各国实力的强弱,为德国的君主政体服务。因在外文中“国势” 与“统计”词义相通,后来正式命名为“统计学”。该学派在进行国势比较分析中,偏重事物性质的解释,而不注重数量对比和数量计算,但却为统计学的发展奠定了经济理论基础。但随着资本主义市场经济的发展,对事物量的计算和分析显得越来越重要,该学派后来发生了分裂,分化为图表学派和比较学派。
-
政治算术学派
政治算术学派产生于 19 世纪中叶的英国,创始人是威廉 · 配第(1623-1687),其代表作是他于 1676 年完成的《政治算术》一书。这里的 “政治” 是指政治经济学,“算术”是指统计方法。在这部书中,他利用实际资料,运用数字、重量和尺度等统计方法对英国、法国和荷兰三国的国情国力,作了系统的数量对比分析,从而为统计学的形成和发展奠定了方法论基础。因此马克思说:“威廉 · 佩蒂——政治经济学之父,在某种程度上也是统计学的创始人。”1
政治算术学派的另一个代表人物是约翰 · 格朗特(1620-1674)。他以 1604 年伦敦教会每周一次发表的 “死亡公报” 为研究资料,在 1662 年发表了《关于死亡公报的自然和政治观察》的论著。书中分析了 60 年来伦敦居民死亡的原因及人口变动的关系,首次提出通过大量观察,可以发现新生儿性别比例具有稳定性和不同死因的比例等人口规律;并且第一次编制了“生命表”,对死亡率与人口寿命作了分析,从而引起了普遍的关注。他的研究清楚地表明了统计学作为国家管理工具的重要作用。
(二)统计学的发展时期
18 世纪末至 19 世纪末是统计学的发展时期。在这时期,各种学派的学术观点已经形成,并且形成了两主要学派,即数理统计学派和社会统计学派。
-
数理统计学派
在 18 世纪,由于概率理论日益成熟,为统计学的发展奠定了基础。19 世纪中叶,把概率论引进统计学而形成数理学派。其奠基人是比利时的阿道夫 · 凯特勒(1796-1874),其主要著作有:《论人类》、《概率论书简》、《社会制度》和《社会物理学》等。他主张用研究自然科学的方法研究社会现象,正式把古典概率论引进统计学,使统计学进入一个新的发展阶段。由于历史的局限性,凯特勒在研究过程中混淆了自然现象和本质区别,对犯罪、道德等社会问题,用研究自然现象的观点和方法作出一些机械的、庸俗化的解释。但是,他把概率论引入统计学,使统计学在 “政治算术” 所建立的 “算术” 方法的基础上,在准确化道路上大大跨进了一步,为数理统计学的形成与发展奠定了基础。
-
社会统计学派
社会统计学派产生于 19 世纪后半叶,创始人是德国经济学家、统计学家克尼斯(1821-1889), 主要代表人物主要有恩格尔(1821-1896)、梅尔(1841-1925)等人。他们融合了国势学派与政治算术学派的观点,沿着凯特勒的 “基本统计理论” 向前发展,但在学科性质上认为统计学是一门社会科学,是研究社会现象变动原因和规律性的实质性科学,以此同数理统计学派通用方法相对立。社会统计学派在研究对象上认为统计学是研究体而不是个别现象,而且认为由于社会现象的复杂性和整体性,必须地总体进行大量观察和分析,研究其内在联系,才能揭示现象内在规律。这是社会统计学派的 “实质性科学” 的显著特点。
社会经济的发展,要求统计学提供更多的统计方法;社会科学本身也不断地向细分化和定量化发展,也要求统计学能提供更有效的调查整理、分析资料的方法。因此,社会统计学派也日益重视方法论的研究,出现了从实质性方法论转化的趋势。但是,社会统计学派仍然强调在统计研究中必须以事物的质为前提和认识事物质的重要性,这同数理统计学派的计量不计质的方法论性质是有本质区别的。
二、20 世纪——迅速发展的统计学
20 世纪初以来,科学技术迅猛发展,社会发生了巨大变化,统计学进入了快速发展时期。归纳起来有以下几个方面。
-
由记述统计向推断统计发展。
记述统计是对所搜集的大量数据资料进行加工整理、综合概括,通过图示、列表和数字,如编制次数分布表、绘制直方图、计算各种特征数等,对资料进行分析和描述。而推断统计,则是在搜集、整理观测的样本数据基础上,对有关总体作出推断。其特点是根据带随机性的观测样本数据以及问题的条件和假定(模型),而对未知事物作出的,以概率形式表述的推断。目前,西方国家所指的科学统计方法,主要就是指推断统计来说的。
-
由社会、经济统计向多分支学科发展。
在 20 世纪以前,统计学的领域主要是人口统计、生命统计、社会统计和经济统计。随着社会、经济和科学技术的发展,到今天,统计的范畴已覆盖了社会生活的一切领域,几乎无所不包,成为通用的方法论科学。它被广泛用于研究社会和自然界的各个方面,并发展成为有着许多分支学科的科学。
-
统计预测和决策科学的发展。
传统的统计是对已经发生和正在发生的事物进行统计,提供统计资料和数据。20 世纪 30 年代以来,特别是第二次世界大战以来,由于经济、社会、军事等方面的客观需要,统计预测和统计决策科学有了很大发展,使统计走出了传统的领域而被赋予新的意义和使命。
-
信息论、控制论、系统论与统计学的相互渗透和结合,使统计科学进一步得到发展和日趋完善。
信息论、控制论、系统论在许多基本概念、基本思想、基本方法等方面有着共同之处,三者从不同角度、侧面提出了解决共同问题的方法和原则。三论的创立和发展,彻底改变了世界的科学图景和科学家的思维方式,也使统计科学和统计工作从中吸取了营养,拓宽了视野,丰富了内容,出现了新的发展趋势。
-
计算技术和一系列新技术、新方法在统计领域不断得到开发和应用。
近几十年间,计算机技术不断发展,使统计数据的搜集、处理、分析、存贮、传递、印制等过程日益现代化,提高了统计工作的效能。计算机技术的发展,日益扩大了传统的和先进的统计技术的应用领域,促使统计科学和统计工作发生了革命性的变化。如今,计算机科学已经成为统计科学不可分割组成部分。随着科学技术的发展,统计理论和实践深度和广度方面也不断发展。
-
统计在现代化管理和社会生活中的地位日益重要。
随着社会、经济和科学技术的发展,统计在现代化国家管理和企业管理中的地位,在社会生活中的地位,越来越重要了。人们的日常生活和一切社会生活都离不开统计。英国统计学家哈斯利特说:“统计方法的应用是这样普遍,在我们的生活和习惯中,统计的影响是这样巨大,以致统计的重要性无论怎样强调也不过分。” 甚至有的科学有还把我们的时代叫做 “统计时代”。显然,20 世纪统计科学的发展及其未来,已经被赋予了划时代的意义。
三、今天的统计学
在科学技术飞速发展的今天,统计学广泛吸收和融合相关学科的新理论,不断开发应用新技术和新方法,深化和丰富了统计学传统领域的理论与方法,并拓展了新的领域。今天的统计学已展现出强有力的生命力。在我国,社会主义市场经济体制的逐步建立,实践发展的需要对统计学提出了新的更多、更高的要求。随着我国社会主义市场经济的成长和不断完善,统计学的潜在功能将得到更充分更完满的开掘。
第一,对系统性及系统复杂性的认识为统计学的未来发展增加了新的思路。由于社会实践广度和深度迅速发展,以及科学技术的高度发展,人们对客观世界的系统性及系统的复杂性认识也更加全面和深入。随着科学融合趋势的兴起,统计学的研究触角已经向新的领域延伸,新兴起了探索性数据的统计方法的研究。研究的领域向复杂客观现象扩展。21 世纪统计学研究的重点将由确定性现象和随机现象转移到对复杂现象的研究。如模糊现象、突变现象及混沌现象等新的领域。可以这样说,复杂现象的研究给统计开辟了新的研究领域。
第二,定性与定量相结合的综合集成法将为统计分析方法的发展提供新的思想。定性与定量相结合的综合集成方法是钱学森教授于 1990 年提出的。这一方法的实质就是将科学理论、经验知识和专家判断相结合,提出经验性的假设,再用经验数据和资料以及模型对它的确实性进行检测,经过定量计算及反复对比,最后形成结论。它是研究复杂系统的有效手段,而且在问题的研究过程中处处渗透着统计思想,为统计分析方法的发展提供了新的思维方式。
第三,统计科学与其他科学渗透将为统计学的应用开辟新的领域。现代科学发展已经出现了整体化趋势,各门学科不断融合,已经形成一个相互联系的统一整体。由于事物之间具有的相互联系性,各学科之间研究方法的渗透和转移已成为现代科学发展的一大趋势。许多学科取得的新的进展为其他学科发展提供了全新的发展机遇。模糊论、突变论及其他新的边缘学科的出现为统计学的进一步发展提供了新的科学方法和思想。将一些尖端科学成果引入统计学,使统计学与其交互发展将成为未来统计学发展的趋势。统计学也将会有一个令人振奋的前景。今天已经有一些先驱者开始将控制论、信息论、系统论以及图论、混沌理论、模糊理论等方法和理论引入统计学,这些新的理论和方法的渗透必将会给统计学的发展产生深远的影响。
统计学产生于应用,在应用过程中发展壮大。随着经济社会的发展、各学科相互融合趋势的发展和计算机技术的迅速发展,统计学的应用领域、统计理论与分析方法也将不断发展,在所有领域展现它的生命力和重要作用。
参考文献:
- 《统计学的三个发展阶段及其性质分析》,载《统计与决策》2003 年第 11 期。
- 《科学的融合促进统计学的未来发展》,载《统计与预测》2001 年第 4 期。
- 《20 世纪统计学的回顾与展望》,载《统计研究》2000 年第 9 期。
- 《统计学生命力的重新审视》,载《统计与决策》2000 年第 2 期。
- 《统计学的产生与发展》,载《曲阜师范大学学报》2003 年第 2 期。
- 《20 世纪统计学的新发展》,载《统计与预测》1999 年第 6 期。
- 《论知识经济条件下统计学的发展》,载《经济师》2001 年第 5 期。
- 《统计学专业发展的历史机遇》,载《统计与信息论坛》1999 年第 4 期。
- 《统计学发展历史的探讨》,载《价格与市场》2003 年第 9 期。