第一章 产品背景
现代社会被称为“信息社会”,信息技术渗透到政治、经济、产业、服务领域的所有部门,信息化产业在国民经济中占有的比重越来越大。信息化产业发展水平和信息基础设置建设水平,是衡量社会现代化的重要指标。随着互联网、物联网、移动互联网、大数据等领域的发展,社会信息化达到了前所未有的高度,极大刺激了我国的经济发展。社会信息化程度越高,产生的信息数据越多,数据安全的问题就越突出。在享有信息化高速发展带来便利和效率的同时,如何有效的保护信息安全,是摆在政府、企业、个人面前的共同问题。
在技术发展过程中,传统透明加密技术大大提高了数据安全的发展和影响。透明加密是一种自动加密技术,所谓透明指软件对文档的加密和解密对用户来说是无感知的,通过对终端下发策略,实现指定类型文档自动、强制性进行加密,构建一个电子文档安全使用环境,企业安全环境内可以透明使用,以任何非法方式带离安全环境均无法使用。同时电子文档加密后,以密文形式进行存储、传输和使用,实现从数据的整个生命周期进行术安全保护。
透明加密技术一定程度上解决了数据安全问题,但是也带来一定的弊端,由于数据过度(非核心数据),我们需要牺牲一些工作效率。对于一个企业来说,不同的数据价值不同,而我们往往关注的是核心数据资产安全,对于一些非核心数据没需过度防护,数据安全应根据部门涉密程度的不同(如核心部门和普通部门),部署力度轻重不一的梯度式防护,将技术、管理、审计进行有机的结合,在内部构建起立体化的整体信息防泄漏体系,使得成本、效率和安全三者达到最优平衡,才能实现真正意义上的数据安全。
亿赛通作为数据安全方案领航者,及客户之所急,想客户之所想,正式推出智能加密安全解决方案。
第二章 检测与准确性
为了实现核心文档数据加密,无论数据的存储、复制或传输位置在哪里,都必须准确地检测所有类型的机密数据。如果没有准确的检测,就会造成该加密的机密信息没有加密,不该加密的机密文档被加密。
为了确保最高的准确性,亿赛通智能加密采用了多种检测技术,来保障核心文档数据数据识别有效性和准确性。
二.1 基础检测技术
正则表达式检测(标示符)
关键字和关键字对检测
文档属性检测
基础检测方法采用常规的检测技术进行内容搜索和匹配,比较常见的都是正则表达式和关键字,此两种方法可以对明确的敏感信息内容进行检测;文档属性检测主要是针对文档的类型、文档的大小、文档的名称进行检测,其中文档的类型的检测是基于文件格式化进行检测,不是简单的基于后缀名检测,对于修改后缀名的场景,文件类型检测可以准确的检测出被检测文件的类型,目前支持100多种标准的文件类型,并且可以通过自定义特征,去识别特殊的文件类型格式的文档。
二.2 高级检测技术
指纹文档比对 (IDM)
“指纹文档比对”(IDM) 可确保准确检测以文档形式存储的非结构化数据,例如 Microsoft Word 与 PowerPoint 文件、PDF 文档、财务、并购文档,以及其他敏感或专有信息。IDM 会创建文档指纹特征,以检测原始文档的已检索部分、草稿或不同版本的受保护文档。
IDM 首先要进行敏感文件的学习和训练,拿到敏感内容的文档时, IDM采用语义分析的技术进行分词,然后进行语义分析,提出来需要学习和训练的敏感信息文档的指纹模型,然后利用同样的方法对被测的文档或内容进行指纹抓取,将得到的指纹与训练的指纹进行比对,根据预设的相似度去确认被检测文档是否为敏感信息文档。这种方法可让 IDM 具备极高的准确率与较大的扩展性。
第三章 支持文件类型
类别 | 产品能力 |
图片 | 支持对电子扫描TIFF图片等OCR格式进行内容文字识别,可识别图片格式的文字内容 |
常规文档 | 支持识别常规文件格式及内容,包括MS Offico、永中Office、书生Office、WPS等生成的doc、docx、xls、xlsx、ppt、pptx、pdf、zip、rar、txt等格式 |
压缩包或嵌套文件 | 支持识别多层压缩文件、多层嵌套文件(如Word里嵌套Excel、PPT及TXT等) |
密码保护文档 | 支持识别被密码保护的常规文件(如Office 2003-2013、RAR、ZIP、PDF文档等) |
大容量文件 | 支持识别单个大容量文件(如文件大小为1GB以上) |
多种编码格式 | 支持Unicode、GB18030、UTF-8等多种编码格式 |
第四章 智能加密介绍
智能加密是一种全新的加密技术,它融合了透明加密和内容智能识别技术,用户打开文档时,客户端根据服务器下发的安全策略,对文档内容进行检测,如果检测到敏感文档中还有机密信息,则会自动加密,整个过程对使用者来说是无感知的。