初探大数据与云计算的应用领域与发展前景
摘 要:在新的信息化时代中,数据量级越来越大,数据类型越来越多,大数据技术无疑是当前最有潜力的研究领域。大数据技术中广泛采用分布式的架构,包括分布式存储与分布式处理,而云计算正是一种十分有效的分布式计算方法,两者的结合使用有许多领域都有着广泛的应用。
关键词:大数据 ;云计算
1 引言
物联网、大数据、云计算标志着第三次信息化浪潮的到来,为解决新时代数据量级迅速增长的信息爆炸问题,许多企业如Facebook、亚马逊、今日头条等陆续发现了大数据技术与云计算的优势并展开了相关的科学研究和技术应用,我国也提出了国家大数据战略,加快建设数字中国。第三次浪潮的信息社会不再以体能和机械能为主而是以智能为主,大数据与云计算在新时代中的重要性就不言而喻了。
2 大数据
2.1 大数据的定义
近年来,我们总能听到大数据。维基百科上将大数据定义为利用常用软件工具捕获、管理和处理数据所耗时间超过可容忍时间的数据集。有人将大数据比作原油,也有人将其比作煤矿,本质上都是对大数据难以获取、难以管理、需要处理、需要开发、潜在有用等要素的描述。
2.2 大数据的特点
大数据的特点可以用“5V”来概括:Volume规模,其数据规模一般在GB、TB、PB级别,数据量越大,就越可能存在更多潜在的有用信息;Value价值,大数据中包含大量数据,具有可用价值的却占比较少,其价值密度很低;Velocity速度,大数据中以流式动态数据为主,获取数据的速度非常快,系统反应时间在毫秒级别,对系统的要求较高;Variety种类,其数据类型多样,包含结构化数据、非结构化数据甚至是半结构化数据,这些数据混杂在一起,不利于统一的数据库存储;Veracity真实性,由于数据不一致和不完整、歧义、延迟、欺骗、模型近似而导致的不确定性,该特征反映了数据的质量。
除此之外,大数据也有可变性、复杂性等特点。
2.3 大数据的意义
现在的数据产生模式已经发生了根本变化,从前只有少部分公司会产生数据,其他的用户只是在使用这些数据,而现在的新模式下,所有用户都在产生数据和使用数据,这也是信息爆炸的一个产生原因。大规模的数据即造成了数据获取与存储的困难,也让有用的数据信息被淹没在大量无关信息之中,大数据技术的意义就是挖掘出这些有用的数据并加以合理的利用,即从“大”转化为“有用”。从经济发展层面上来说,企业可以利用足够规模的数据针对大量消费者进行精准营销;对中、小、微型企业和传统企业来说,则可以利用大数据推动和完成服务转型;利用大数据分析,可以帮助各企业降低生产成本、提高开发效率、做出精准业务决策等等。
3 云计算
3.1 云计算的概述
云计算采用一种“分而治之”的思想,设置多个服务器组成的架构,通过网络“云”将原先庞大复杂的数据计算处理程序分解成大量的、分块的小程序,将小程序分配给不同的服务器进行处理分析,将各服务器地得到结果并返回给用户,属于分布式计算系统。云计算作为一个架构上能够无限扩展、功能上提供资源的网络,与用户对接后,用户可以随时按需求量获取“云”上的资源;云计算与信息技术、软件、互联网息息相关,在计算资源共享环境下,整个计算系统通过软件实现自动化管理,只需要极少的人工成本与操作成本就能快速地为用户提供相应资源(罗晓慧,2019)。
3.2 云计算的特点
(1)云计算采用虚拟化技术,相关的终端操作由虚拟化平台完成,摆脱了物理空间的桎梏,降低了计算机的硬件要求;
(2)云计算运算能力很强,并且是动态可扩展的,使得用户可以很方便地在现有的服务器中增加云计算功能从而实现运算速度的极大提升;
(3)云计算平台能够实现按需部署,用户需求是重点评估标准,在资源配备时能优先满足用户需求;
(4)云计算的灵活性高,兼容性强,不同的产品、不同的硬件、不同的架构都能很好地兼容,外还能设的灵活使用;
(5)云计算的可靠性高,得益于虚拟化技术,云计算将应用存储在不同物理服务器上,利于应用的恢复或是创建镜像服务器;
(6)云计算与传统的主机存储相比,占用较少的物理空间,还保证了良好的计算性能,有着更高的性价比。
3.3 生活中的云计算
(1)基础、简单的云计算:网络搜索引擎、网络邮箱,普遍服务于现如今的互联网服务中;
(2)存储云:用户可以将本地的资源上传至云端,在文件存储、用户信息、行业数据等方面都应用广泛。云端资源作为备份,让使用者可以在随时随地连入互联网来获取云上存储的资源。代表有国外的微软、谷歌,国内的百度云、阿里云等等;
(3)医疗云:在医疗云的帮助下,预约挂号、电子医保、线上就诊、电子病历等服务既方便了普通百姓,也让医院的运作更为高效,管理更为有效;在保证患者数据安全、实现医院水准与环境信息共享、动态扩展患者群体分析架构、布局全国等方面,医疗云也大有助益;
(4)金融云:快捷支付已经深入我们的生活,利用手机扫码或是刷脸可以迅速完成付款、交易、买卖等,这就是金融云的功劳;银行、基金、保险等各金融机构越来越需要金融云提供的IT资源和互联网运维服务以促进自身运转与转型;目前,阿里云率先开发出自己的金融云服务,苏宁金融、腾讯等企业都陆续跟进;
(5)教育云:最为典型的例子就是MOOC,越来越多的大学开始加入或开设MOOC,将课程上传至云端,既方便教育机构对教学内容的更新与把控,也有利于学生随时随地进行课程学习。
4 两者相结合的应用领域
大数据与云计算密不可分。使用单台计算机进行大数据处理是非常困难的,采用分布式架构才能有效地进行大数据分析,因此分布式存储与分布式计算是大数据的两大重要组成部分,而云计算的分布式计算架构以及虚拟化、共享化技术可谓是为大数据量身定做,云计算的高效运算能力适合于大量而又快速的大数据领域。大数据为信息技术提供足够数据支撑,云计算则代表着更高效更便捷的发展方向,两者相结合的应用能够推动信息技术进入全新的发展阶段。
4.1 人工智能
人工智能是研究、开发用于模拟、延伸和扩展人的智能的理论、方法、技术及应用系统的一门新的技术科学,其理论领域与应用领域都非常广泛。人工智能试图探求智能产生的本质,并由人工生产出具有与人类相似智能的智能机器,而对机器来说智能的真正载体是有算法和数据支撑的软件。而新时代下信息技术高速发展,为了满足不同用户的具体需求,越来越多的智能设备开始出现,大量设备的接入带来的大量的数据生成,也需要高效的处理架构,大数据与云计算就体现出了他们的价值。
毋庸置疑的是,人工智能、大数据和云计算三体合一的趋势越来越强。人工智能正逐渐渗透进人们的日常生活,不同的人工智能产品与服务是为了不同的用户需求而开发的,而在大数据的数据支撑与云计算的计算支撑下,即使在极大的用户基数下也能够及时有效地获取不同人群的需求匹配,从而更好地为用户提供周到而具有针对性的服务,更有针对性地进行相关产品的开发,更为高效地进行相关维护工作。
在日常生活中,智能手机中有着非常多的软件应用,如果仅仅使用手机自带的存储系统,再大的空间也会被海量的应用数据填满,这时使用云存储方式,利用一定容量的云空间存储诸如音乐缓存、游戏存档、浏览器缓存等数据,让用户在需要时将云端数据下载至本地,还能减少数据加载时间,真正做到随时随地、方便快捷。
机器学习作为使计算机拥有智能的根本途径,是人工智能的核心。以聚类方法为例子,聚类处理的对象是数据组成的集合,在无监督的学习环境下生成一个簇,簇内对象与同一个簇中的对象彼此相似,与其他簇中的对象相异,所谓“物以类聚”。比较传统的大数据聚类方法是进行多次迭代,但是这种方法的聚类效率并不如人意。在引入云计算后对大数据聚类算法进行优化,既能是得到的聚类特征更为明显,还能提高分析效率与准确度。(张海清,2022)
4.2 物联网
物联网是一个基于互联网、传统电信网等的信息承载体,让所有能够被独立寻址的普通物理对象形成互联互通的网络。物联网注重人与物、物与物之间的信息交互,包含了大量的用户信息与物品信息和广泛复杂的关系网络,物联网还充分地运用了多种感知技术,使用不同种类的传感器捕获不同形式的信息格式与信息内容,将大数据处理方法应用在物联网中具有现实意义。
物联网为了实现“万物相连”的互联互通,需要大量的数据支撑,而各种信息之间的格式与内容千差万别,物品可能存在多种属性,每个属性的数据表现形式又可能大相径庭,用一般方法难以存储与管理,而大数据方法本身就是为了处理大量多种类型、多种格式的数据以便进行数据库存储,利用大数据可以解决物联网数据采集的问题;而当物品与物品、物品与用户之间存在复杂的关系,物联网中的交互信息会大量产生与变化,这又生成了新的大数据,在大数据的帮助下就可以让物联网能够接受新数据加入的同时能够很好地维护物联网中已有信息。
云计算方面,云计算主要可以为物联网中的用户提供基础设施、操作平台、应用软件,充分发挥云计算的海量存储与高效运算的优势。
4.3 审计
大数据与云计算在市场经济管理中也能发挥作用,最明显的就是审计工作。审计是指由专设机关依照法律对国家各级政府及金融机构、企业事业组织的重大项目和财务收支进行事前和事后的审查的独立性经济监督活动。企业之间有着大量的经纪业务往来,产生经营信息,科学有效的审计工作有助于杜绝经济违规违法行为,保证企业财务信息的真实性与准确性;审计结果可反馈给管理层,监督企业合法经营问题,降低企业的风险并指导企业的发展方向。
在引入大数据与云计算技术后,从审计方式上来说,在网络上搭建审计平台成为可能,从海量信息中提取审计所需的价值信息,并能够实时审核获取的数据,保证审计工作时效性;从数据审计方法上来说,利用样本即总体的思想,既能保证审计信息的可靠性与真实性,也能在保质保量的同时极大地提高审计工作的效率;从审计证据上来说,大数据与云计算能够为审计报告提供跨领域、经量化的审计证据,为审计结果提供依据,增加审计报告的可信度,也有利于审计工作细节的完善。
利用大数据与云计算,审计行业可以利用足够的数据与先进的技术建立云审计平台与大数据审计平台,实现远程存储与移动性测算,降低数据信息损耗量;在有专业的审计人员参与下,开发出先进的标准化审计程序,既可以提升审计工作效率,宏观上也加快了审计行业发展;结合云计算的高速计算与云端存储,管理部门可以快速地获取来自各地各企业的行业审计结果,在合理的统筹规划下及时地作出新一步的发展规划,实现程序式、规范性运行效果。(潘昕,2022)
5 发展前景
5.1 技术开发
大数据与云计算的结合让大数据分析技术发展打破了之前的限制。云计算的云端存储能力与强大计算能力极大地降低了数据处理时的成本,提高了数据开发与分析的效率,而在进一步的云平台的使用中,数据处理流程得到简化,无需花费时间在数据形式的转换与二次处理上,保证了数据处理的效率和质量。
云计算使得大数据技术的使用与开发进入崭新的阶段。具体来说,若采用云计算技术构建大数据系统处理模型,将各种形式的数据从物理计算机上迁移至云端,形成虚拟存储空间,就可以减少硬件设备的使用成本,在海量数据处理的情景下也能保证良好的效率与效果;在基于云计算的计算机互联网分析平台上,云计算为使用者提供了多种数据分析方法,在充分满足用户需求的同时给予专业准确的分析结果,服务效果良好;数字存储应用平台依赖于云计算技术,大量利用虚拟云存储图像、声音、文字、视频等多种形式的数据,并能通过数据挖掘得到潜在有用的价值信息,并进行整合归档工作。(魏镜郦,2022)
5.2 应用行业
现在,许多行业都认识到了大数据与云计算的优势并尝试加以利用来推动自身发展。在销售行业已经形成了相对完善的大数据云计算系统建设,主要用于精准营销、商品信息共享、消费者水平分析等,帮助商家进行商业目标规划与了解市场动向;医疗行业正在探索“互联网+”新型医疗模式,大数据与云计算系统的使用让医疗服务的效率得到了有效的提高,医疗服务的水平、专业性、针对性也有了质的飞跃,极大地推动了新医疗模式的发展;城市中交通运输的智能化发展也涉及到了大数据分析,通过分析早晚高峰、节假日流量数据建设智慧交通系统,有效地缓解了城市交通堵塞的问题,还能帮助规划最优出行方案以及进行城市交通管理。今后也会有越来越多的行业与领域利用大数据与云计算推动数字化转型发展。(梁海军,2022)
5.3 网络空间安全问题
尽管云计算能够带来更高效的计算和更灵活的扩展,但云计算架构中仍存在安全威胁。云计算中存储了大量信息,其信息管理难度很高;与之相对的,云计算允许用户随时接入互联网,但这也让怀有恶意的不法分子有了可乘之机,黑客可以利用非法手段或是系统漏洞很容易地入侵云计算网络,大量窃取用户信息、交易信息、企业文件数据甚至隐私信息等;而被盗用的信息可能经修改或替换后重新上传至云端,造成资源冒用。为解决网络空间安全问题,在云计算领域还需要利用数据加密技术、数据访问技术、身份认证技术等保障数据安全性的技术,使用数据加密在数据传输阶段防止黑客窃取,提高身份认证水平阻止黑客入侵,优化数据访问方式在数据访问环节使用科学的访问方法。(钟思etal.,2022)
6 总结
大数据时代下数据量的指数增长与计算量的速度要求让云计算技术的优势逐渐被发现与重视。大数据与云计算广泛应用于各研究领域与市场行业,可见其在当今信息时代下独有的优势,而大数据技术作为朝阳产业,仍在不断发展,未来能够创造更多的价值。
参考文献
张海清.2022.大数据结合云计算的人工智能创新发展研究.产业创新研究,(20):3.
梁海军.2022.新时期对大数据与云计算网络技术的思考.产业创新研究,(018):000.
潘昕.2022.大数据、云计算对审计的影响.中国集体经济,(33):157–159.
罗晓慧.2019.浅谈云计算的发展.电子世界,(8):1.
钟思,何国民,袁煜,帅剑平,and陈辉金.2022.基于大数据和云计算的网络空间安全防御研究.科技创新与应用,12(10):4.
魏镜郦.2022.云计算技术在计算机大数据分析中的应用思考.现代工业经济和信息化,12(9):3.