大数据安全

一. 大数据安全的问题

信通院将大数据安全分为了平台安全、数据安全和隐私保护三个层次,自下而上为依次承载的关系,以大数据平台为基本出发点,形成了大数据安全总体视图。

但是从大数据安全整体的角度看,最上层只包含隐私保护有点不完整。数据的上层是语义,相应的安全是属于内容安全。除了隐私问题外,舆情信息、社交媒体内容等安全问题都应归入这个层次。

 

二. 什么是大数据安全

第一类是大数据带来的风险问题:这种风险是指大数据被收集、挖掘后导致的安全风险,通常表现为语义上的安全,就是内容安全。这与国家的“11种安全”(政治安全、国土安全、军事安全、经济安全、文化安全、社会安全、科技安全、信息安全、生态安全、资源安全、核安全)密切相关。

比如,白皮书中提到了美国一款健身应用软件将用户健身数据的分析结果在网络上公布,结果涉嫌泄露美国军事机密。这款软件名为斯特拉瓦,是一款集健身和社交功能为一体的应用。用户可以将自己运动时间、成绩、轨迹等信息通过网络上传至应用服务器,与他人分享。然而,由于不少美军现役军人在使用这款应用,许多美军基地的地理位置因此在热力图上清晰地显现出来。大量军事基地方位遭曝光,引发各界关注。

第二类是大数据平台自身的安全问题:与现在人们常说的安全问题比较接近,包括了窃取数据、瘫痪系统、系统入侵等等。大数据平台安全是对大数据平台传输、存储、运算等资源和功能的安全保障,包括传输交换安全、存储安全、计算安全、平台管理安全以及基础设施安全。

第三类,为了区别于传统数据安全的提法,我把它称为数据操纵风险。由于大数据分析挖掘结果会直接被用来指导各种活动,比如制定客户优惠体系、发现优质客户等等,因此竞争对手可以通过应用系统制造恶意数据,产生噪声数据,从而导致大数据分析结果产生偏差。

大数据安全问题的解决无法在传统安全的框架中进行,需要从“大安全”的视角认识和解决大数据安全问题,打破传统的重技术的安全保护思维模式,建立涉及经济、法律、技术等多角度全方位的大数据安全保障体系。

 

三. 大数据安全面临的一些挑战性技术问题

这些问题,可以作为研究生选题的一些思考方向,主要有:

1、大数据平台在 Hadoop/Spark开源模式下缺乏整体安全规划,自身安全机制存在局限性

2、大数据平台服务用户众多、场景多样,传统安全机制的性能难以满足需求

3、大数据平台的大规模分布式存储和计算模式导致安全配置难度成倍增长

4、针对大数据平台网络攻击手段呈现新特点,传统安全监测技术暴露不足

5、数据泄露事件数量持续增长,造成的危害日趋严重

6、数据采集环节成为影响决策分析的新风险点 :目前尚无严格的数据真实性、可信度鉴别和监测手段,无法识别并剔除虚假甚至恶意的数据,最终容易噪声数据操控。

7、数据处理过程中的机密性保障问题逐渐显现

8、数据流动路径的复杂化导致追踪溯源变得异常困难

9、传统隐私保护技术因大数据超强的分析能力面临失效的可能

10、传统隐私保护技术难以适应大数据的非关系型数据库

posted on 2018-09-17 08:42  时间朋友  阅读(1014)  评论(0编辑  收藏  举报

导航