大数据安全的解决思路

本文从大数据平台下的安全问题,引出大数据安全的法规标准、防护思路及解决方案。

引言

随着互联网、物联网、云计算等技术的快速发展,全球数据量出现爆炸式增长;根据IDC研究的“大数据摩尔定律”表明,人类社会产生的数据一直在以每年50%的速度增长,也就是说,每两年就增加一倍。在大数据不断向各个行业渗透、深刻影响国家的政治、经济、民生和国防的同时,其安全问题也将对个人隐私、社会稳定和国家安全带来巨大的潜在威胁与挑战。

政务信息化的推进,电信、金融、互联网等行业的平台升级,加速推进大数据安全和隐私保护需求。为了应对这些需求,我国正在开展的全国网络安全执行大检查行动中,首次开展针对大数据安全的整治工作,具体包括大数据的采集、传输、存储、处理、交换、销毁等全生命周期的监控与保护。

一、大数据平台下的安全问题

大数据平台涉及到的内容比较广泛,安全问题可以从这5个维度去考虑,安全管理、平台安全、数据安全、运维安全、业务安全。

1、安全管理

安全管理是指大数据平台安全管理方面的要求,包括管理制度、机构和人员管理、系统建设管理、运维管理等内容及配套管理流程。安全防护离不开管理与技术协同,国家、政府、行业自上而下应该有安全管理制度和管理流程,指导具体安全工作的开展和实施。

 

2、平台安全

平台安全指平台主机、系统、组件自身的安全和身份鉴别、访问控制、接口安全、多租户管理等安全问题,是对大数据平台传输、存储、运算等资源的安全防护要求。企业大多数都使用基于社区化、开源化组件的Hadoop平台,缺乏安全方面的考虑。

 

3、数据安全

数据属于一种资产,有6个生命周期阶段:采集、传输、存储、处理、交换、销毁;数据安全要保障数据在任何阶段下都是安全的。围绕数据全生命周期考虑数据安全问题,例如:数据采集阶段的分类分级、清洗比对、质量监控;数据传输阶段的安全管理;数据存储阶段的安全存储、访问控制、数据副本、数据归档、数据时效性;数据处理和交换阶段的分布式处理安全、数据加密、数据脱敏、数据溯源;数据交换阶段的数据导入导出、共享、发布、交换监控;数据销毁阶段的介质使用管理、数据销毁、介质销毁等安全问题。

 

4、运维安全

运维人员的权限相对较大,运维人员直接对数据库进行操作,涉及的数据量非常大,数据的安全难以保障。例如:内部人员的误操作导致数据丢失或不可用,蓄谋恶意行为导致数据泄露。

 

5、业务安全

业务安全跟业务强相关,跟应用场景和业务流量特征有关,一般的防护手段很难发现,涉及到业务学习和行为分析。例如:缓慢少量攻击、共谋、在噪音中隐身、持续渗漏尝试、长期潜伏者等。

二、大数据安全法规标准

大数据时代是万物互联的时代,数据在共享中体现价值,因此,国内外法律法规也终将完善大数据安全领域的防护和技术要求,助力大数据安全建设。

国家、政府、各行业相继出台大数据平台安全和数据安全相关的国标、行标、企标、地标,推动大数据产业的良性发展。《中华人民共和国网络安全法》、《中华人民共和国计算机信息系统安全保护条例》、《等保2.0》、《个人信息安全规范》、《GDPR》、《电信网与互联网大数据平台安全防护技术要求》等。

三、大数据安全防护思路与解决方案

数据共享是必然需求,大数据安全的防护目标要在保障业务正常的前提下,以合理成本,保护大数据平台下数据的安全。业务需求与风险并存,防护要在业务需求与风险之间寻求平衡,对不同价值和属性的数据,在不同业务需求下,实施不同级别的防护措施,控制防护成本。

1、防护思路

大数据安全防护方案可按层次考虑,平台安全、数据安全、运维安全、业务安全,层层深入,逐步提升安全性。

1、平台安全

数据的存储和流转依托大数据平台和各业务系统,平台自身安全是第一步,通过平台各组件与系统的漏洞扫描管理、规范化的基线核查管理、平台态势感知,确保大数据平台的安全运行。

 

2、数据安全

关注数据的安全存储,数据梳理,掌握数据全景图,让数据风险可量化;关注数据在处理、交换、使用时安全,身份认证、访问控制、数据加密、数据脱敏,防止非法或越权访问数据,对数据访问进行管控、数据审计。

 

3、运维安全

收敛大数据平台的数据访问途径,对运维人员访问大数据平台的操作行为进行操作管控、操作审计。

 

4、业务安全

机器学习建模,对敏感数据的访问行为和敏感业务进行机器学习,对用户行为进行分析,感知和预测业务安全风险。

2、国外厂商方案

Gartner在《Market Trends: Database Security, Worldwide, 2017》报告中列出几个Big Data厂商,我们挑选Informatica和Dataguise这2个厂商的方案进行简单介绍。

1、Informatica

该厂商的大数据安全解决方案支持对结构化、非结构化数据做发现、分类、风险评分,数据访问和操作监控,发现可疑或未授权操作,数据保护,敏感数据扩散跟踪,让风险跟踪处置形成闭环。

2、Dataguise

该厂商提供全局敏感数据管理解决方案,产品旁路部署在大数据集群边界,可实时检测、审计、保护和监视敏感数据资产。

3、绿盟大数据安全防护方案

绿盟结合数据安全防护思路和实操性,从安全平台能力、运维安全管控、监控与评估、管控与处理、审计与分析这几方面去考虑,设计出一套大数据安全防护方案,覆盖平台安全、数据安全、运维安全、业务安全,提供数据发现、分类、分级、评估、监控、保护、审计、溯源、态势感知一整套大数据安全防护方案。

安全平台对接设备,集中管理、日志收集、智能分析,拥有统一策略管理、账号管理、风险告警、态势感知、数据泄露溯源、应急响应编排能力。

监控与评估,从监控的角度入手,首先对大数据平台上的数据做梳理,数据识别、分类、分级、存储位置定位,生成数据全景图,为数据细粒度的访问授权提供依据,同时对动态数据做跟踪,监控数据流转、使用是否符合预期;从评估的角度出发,结合平台自身的组件漏洞、配置安全性及数据在平台上的存储、流转情况做综合评估,全面剖析数据风险,量化数据风险,为大数据平台的态势监测与防护提供有力支撑。

管控与处置,结合客户行业数据特征,提供行业数据分类分级模板;结合客户实际业务需求,灵活提供细粒度访问控制、数据加解密和数据脱敏方案,根据实时应用和业务流量监控,及时处置异常行为,避免进一步风险。

审计与分析,审计指对行为操作和数据访问做审计,为事件问题定位、溯源和大数据分析提供依据;业务安全指基于用户画像和异常行为分析做业务安全风险的感知和预测,及时给出处置策略。

运维安全管控,对平台上所有运维操作进行统一管控和审计,利用运维操作审核机制,防止内部人员私自、独立对平台配置和数据进行操作。(等保2.0要求:大数据平台的管理流量和系统业务流量分离,因此,运维流量和业务流量也要分开做管控)

 

 

四、大数据安全面临的挑战

大数据安全与传统数据安全相比,存在一些差异,大数据环境的特点是分布式、组件多、接口多、类型多、数据量大,这些特性给大数据安全引入了技术难点。

主流开源大数据组件二十多款,还有大量第三方封装的组件,不同组件使用的交互接口不同,安全产品面对这么多组件接口,在监控、防护、溯源的方案设计和技术实现上都有难度。

大数据平台要存储和处理的数据量庞大,IDC预计,到2020年全球数据总量将超过40ZB,面对持续膨胀的数据量,安全产品不仅要提高单机产品的处理性能,还要考虑产品扩容和延展性。

大数据平台要存储和处理的数据类型众多,结构化数据、半结构化数据、非结构化数据。要对非结构化数据做识别、分类分级和脱敏处理,有一定技术难度。

五、大数据安全未来发展方向

由于政务大数据覆盖了自然人、法人、企业、政府机构等,同时和医疗、教育、民生服务等各个部门相关;因此,解决了政务大数据安全问题,就能有效解决其他行业大数据安全问题,有力支撑国家治理体系和治理能力现代化目标的实现。从企业层面来看,国家将统一标准规范,避免行业交流繁杂、数据所有权混乱、开发成本高等一系列问题。统一的数据管理平台,统一的数据存储,统一的数据标准,进行统一的数据资产管理,统一进行授权管理,这是未来探索的一个方向。

 

 

 

 

 

Spread the word. Share this post!

Meet The Author

Leave Comment