网络统计学及其特点
网络统计学
统计学(Statistics)是通过搜索、整理、分析、描述数据等手段,以达到推断所测对象的本质,甚至预测对象未来的一门综合性科学。其中用到了大量的数学及其它学科的专业知识,它的使用范围几乎覆盖了社会科学和自然科学的各个领域。
统计学是从事各类科学研究工作所必须掌握的知识,是人们认识未知世界的有效工具。随着计算机技术的迅猛发展和普及,大量数据的处理技术变得很容易实现,这就使得很多统计方法在现实中的应用也变为可能。目前,统计学技术方法日益渗透到数据挖掘、计算机技术以及专业研究领域,实践应用对统计学理论方法提出更多新要求。
网络统计学(Network Statistics) 是一门新兴的、拓展了的统计学,是在计算机网络和相关软件支持下收集、整理、储存、传递、显示、分析和解释数据,从而反映和揭示自然、社会现象数量特征和数量规律的方法论科学。在分析手段和技术方法上,既重视和继承传统的统计分析方法,更突出现代计算机网络条件下的不同分析手段和技术。随着网络技术的发展和大数据时代的到来,构建网络统计学的技术条件和时机已经成熟,网络统计学必将迎来新的发展机遇。
在计算机网络支持下处理统计数据,面临许多和传统统计学不同的新问题。网络统计学具有如下特点:
**数据载体不同**
统计数据的基本载体不再是“纸张“,而是“磁盘“。在网络环境下,统计数据的主要载体为云空间、网站服务器以及U盘和光盘等;
**数据传输方式不同**
存储在网站服务器端的原始统计数据或经过处理的统计数据可以及时在世界范围发布,也可在用户间(包括微信、博客等)、用户和服务器间即时传递数据;
**数据数据输入、输出方式不同**
网络统计学在处理数据时应可以“读懂“(数据导入、输入)服务器端和客户上传的各种数据,经过处理后的统计数据也必须以特定的格式传递(数据导出、输出)给用户终端。根据统计学的特点,采用人们广泛接受的格式化数据,让“网页”能“读懂“它们,从而实现数据的“自动”输入、输出。为了网络数据传输、为了在处理数据时自动导入数据和输出结果,建立网络统计学数据格式标准至关重要;
**数据处理方式不同**
统计数据处理过程通过网页编程方式实现。具体方式为在服务器端和浏览器页面运用不同软件编程构建分类统计算法函数库,然后通过网络脚本语言调用网络统计分类库函数或再编程解决各种复杂数据处理问题。
网络统计学应用基础技术
网络统计学离不开网页前台编程技术,学习web前端开发基础技术(网页设计)需要了解:HTML、CSS、JavaScript三种语言。这三门技术在网页设计中的用途是:
-
HTML是网页内容的载体:内容就是网页制作者放在页面上想要让用户浏览的信息,可以包含文字、图片、视频、表格等;
-
CSS样式是表现(外观控制或装饰):就像网页的外衣。比如,标题字体、颜色变化,或为标题加入背景图片、边框等。所有这些用来改变内容外观的东西称之为表现;
-
JavaScript是用来实现网页上的动态效果:如鼠标滑过弹出下拉菜单,或鼠标滑过表格的背景颜色改变。还有焦点新闻(新闻图片)的轮换。可以这么理解,有动画的、有交互效果的网页一般都是用JavaScript来实现的。
JavaScript是一种属于网页脚本语言,已经被广泛用于Web应用开发。可以使用JS添加、删除、修改网页上的所有元素及属性;在HTML网页中动态写入文本、数字和插入图表;响应网页中的事件,并做出相应处理。了解JS编程后,可以轻松调用各类网络统计学库函数和在网页上统计数据处理或分析。
网络统计学在计算机网络和相关软件支持下收集、整理、储存、传递、显示、分析和解释数据,HTML、CSS、JavaScript这三种语言是学习和运用网络统计学平台的基础知识。
在互联网技术全面普及发展的今天,网页设计技术已经不是计算机专业从业者的专利,具备大学、甚至高中以上学历的任何专业的人都可以在短时间内通过自学基本掌握这些技术。相对而言,网页脚本JavaScript对于从来没接触过计算机编程的人来说有点难度,HTML和CSS比较容易接受。业内有这样一句话,“入门三天、成手三年”,成为“高手”则需要在实际工作中长期使用和不断学习专研。学习和运用网络统计学不需要多么精的web前端技术,具备入门基础知识即可。
对于常和复杂统计模型打交道的统计工作者来说,学习web前端开发基础技术不是什么难事,"Believe me please, You can do it !"
银河网络统计学技术架构
##统计学理论和方法
概率论和数理统计
统计学方法
地理信息系统和空间统计学
统计数据模拟技术及运用
数据挖掘技术
##网络技术运用
服务器搭建和后台软件支持(PostgreSQL、Mysql、R、Python)
前台网页设计技术(HTML、CSS、Javascrip)
网络统计函数库
Web Service接口开发和运用
##网络统计学在线学习和考试系统
在线数据处理和练习
网络课堂论坛和答疑
在线注册考试认证系统
银河网络统计学构建了强大的统计函数库来处理统计数据和支持统计、数学建模。网络统计学的目标是顺应时代发展趋势,探索统计学、应用数学和IT技术有机结合,尝试大数据条件下新型统计学教学模式。网络统计学具有以下几点优势:
集知识讲解、数据处理、在线测试和问题讨论为一体
理论方法覆盖面广、技术更新速度快
方便使用,易于推广、传播
高效、便捷的数据格式、载体、传输和处理模式
多样化的数据展示方式(文字、表格、公式、图表、图片、声音、视频)
在计算机技术日益普及、大数据运用广泛推广的今天,统计运用软件层出不穷,R、SAS、SPSS、Excel、S-plus、Minitab、Statistica、Eviews等等。随着浏览器的升级、网速的提升,在网页中处理数据的容量和速度也随之不断加强。网页设计三剑客HTML+CSS+Javasript组合已成为网页前台设计的主流,其在数据展示方面的先天优势无可替代。云计算、云存储技术的兴起,为通过网页处理大规模数据提供了保证。通过专门开发设计网络统计函数库,在网页前台可完成大部分数据处理工作,个别云计算、云图绘制等任务可以通过网页提交请求到云端完成后返回。大数据时代的来临是因为网络技术和计算机软硬件技术的发展而催生的,和大数据技术、特别是和数据挖掘技术密切关联的。在现代网络技术条件下,网络统计学的诞生已成为必然趋势!
©哈尔滨商业大学 银河统计工作室
银河统计工作室成员由在校统计、计算机部分师生和企业数据数据分析师组成,维护和开发银河统计网和银河统计博客(技术文档)。专注于数据挖掘技术研究和运用,探索统计学、应用数学和IT技术有机结合,尝试大数据条件下新型统计学教学模式。