2023年7月19日发(作者:)
(19)中华人民共和国国家知识产权局(12)发明专利申请(10)申请公布号
CN 108062484 A(43)申请公布日
2018.05.22(21)申请号 2.8(22)申请日 2017.12.11(71)申请人 北京安华金和科技有限公司地址 100081 北京市海淀区丹棱街6号中关村金融大厦625(72)发明人 杨海峰 温礼辉 (74)专利代理机构 天津盛理知识产权代理有限公司 12209代理人 王利文(51).G06F
21/62(2013.01)
权利要求书1页 说明书2页 附图1页(54)发明名称一种基于数据敏感特征和数据库元数据的分类分级方法(57)摘要本发明涉及一种基于数据敏感特征和数据库元数据的分类分级方法,其技术特点是:根据行业标准建立该标准的数据分类分级;对产生的分类节点中的每个最底层节点配置分类判断规则,同时关联该行业标准应用的数据库;授权扫描数据库,梳理并缓存数据库的敏感数据特征和元数据;依据配置的分类判断规则和缓存的敏感数据特征和元数据依次对每个字段进行分类分级判断。本发明根据数据自身的数据敏感特征和元数据对数据进行类别和等级划分,可广泛地应用于各类数据库安全产品中,依据分类分级结果可以自动化准确地制定不同的审计防控策略,在提高安全产品使用效率的同时可以对重点数据重点防护。CN
108062484
ACN 108062484 A权 利 要 求 书1/1页1.一种基于数据敏感特征和数据库元数据的分类分级方法,其特征在于包括以下步骤:步骤1:根据行业标准建立该标准的数据分类分级;步骤2:对步骤1产生的分类节点中的每个最底层节点配置分类判断规则,同时关联该行业标准应用的数据库;步骤3:授权扫描数据库,梳理并缓存数据库的敏感数据特征和元数据;步骤4:依据步骤2配置的分类判断规则和步骤3缓存的敏感数据特征和元数据依次对每个字段进行分类分级判断。2.根据权利要求1所述的一种基于数据敏感特征和数据库元数据的分类分级方法,其特征在于:所述步骤1的数据分类分级是对数据划分类别并给数据分类配置数据等级。3.根据权利要求2所述的一种基于数据敏感特征和数据库元数据的分类分级方法,其特征在于:所述数据等级包括但不限于极敏感级、敏感级、较敏感级和低敏感级。4.根据权利要求1所述的一种基于数据敏感特征和数据库元数据的分类分级方法,其特征在于:所述分类判断规则是分类信息和数据库字段产生映射的条件;分类判断规则包括该分类所包含的敏感数据特征以及相关元数据的精确和模糊匹配。5.根据权利要求1所述的一种基于数据敏感特征和数据库元数据的分类分级方法,其特征在于:所述敏感数据特征是指一列数据的内容模型,该敏感数据特征是通过对数据库内每张表的字段内容进行部分抽样、预处理分析、正则判断形成的。6.根据权利要求1所述的一种基于数据敏感特征和数据库元数据的分类分级方法,其特征在于:所述的数据库元数据包括但不限于数据库名、模式名、表名、字段名。2CN 108062484 A说 明 书1/2页一种基于数据敏感特征和数据库元数据的分类分级方法技术领域[0001]本发明属于数据库安全技术领域,尤其是一种基于数据敏感特征和数据库元数据的分类分级方法。背景技术[0002]目前,数据库应用已深入到各个领域,沉淀的数据越来越多。随之而来的海量数据在采集、存储、使用、外发等各环节稍不慎都会造成重要敏感数据的泄露甚至是被篡改。引入数据分类分级策略可以对数据库、表、字段实现自动分类分级,进而针对不同类别或者级别数据实行不同的存储、审计和安全管控策略,做到了对数据精准安全管理同时也提高了数据安全管理的效率。如何基于数据敏感特征和数据库元数据进行快速、准确地分类分级是目前迫切需要解决的问题。发明内容[0003]本发明的目地在于克服现有技术的不足,提出一种设计合理、自动程度高且准确率高的基于数据敏感特征和数据库元数据的分类分级方法。[0004]本发明解决其技术问题是采取以下技术方案实现的:[0005]一种基于数据敏感特征和数据库元数据的分类分级方法,包括以下步骤:[0006]步骤1:根据行业标准建立该标准的数据分类分级;[0007]步骤2:对步骤1产生的分类节点中的每个最底层节点配置分类判断规则,同时关联该行业标准应用的数据库;[0008]步骤3:授权扫描数据库,梳理并缓存数据库的敏感数据特征和元数据;[0009]步骤4:依据步骤2配置的分类判断规则和步骤3缓存的敏感数据特征和元数据依次对每个字段进行分类分级判断。[0010]所述步骤1的数据分类分级是对数据划分类别并给数据分类配置数据等级。[0011]所述数据等级包括但不限于极敏感级、敏感级、较敏感级和低敏感级。[0012]所述分类判断规则是分类信息和数据库字段产生映射的条件;分类判断规则包括该分类所包含的敏感数据特征以及相关元数据的精确和模糊匹配。[0013]所述敏感数据特征是指一列数据的内容模型,该敏感数据特征是通过对数据库内每张表的字段内容进行部分抽样、预处理分析、正则判断形成的。[0014]所述的数据库元数据包括但不限于数据库名、模式名、表名、字段名。[0015]本发明的优点和积极效果是:[0016]1、本发明根据数据自身的数据敏感特征和元数据对数据进行类别和等级划分,对不同类别或者级别数据在采集、存储、使用、外发等过程提供更加合适精准的安全操作策略,在提高数据安全防护的同时也提高了数据防护的效率,其处理过程自动化程度高、并且分类结果准确性强。[0017]2、本发明可广泛地应用于各类数据库安全产品中,依据分类分级结果可以自动化3CN 108062484 A说 明 书2/2页准确地制定不同的审计防控策略,在提高安全产品使用效率的同时可以对重点数据重点防护。附图说明[0018]图1是本发明的处理流程图。具体实施方式[0019]以下结合附图对本发明实施例做进一步详述。[0020]一种基于数据敏感特征和数据库元数据的分类分级方法,如图1所示,包括以下步骤:[0021]步骤1:根据行业标准建立该标准的数据分类分级。[0022]本步骤需要根据行业规范标准建立具体的数据分类、对分类节点配置数据等级,数据等级包括但不限于极敏感级、敏感级、较敏感级和低敏感级。同时,可以对已有的分类分级信息导入,从而提高效率。[0023]步骤2:对步骤1产生的分类节点中的每个最底层节点配置分类判断规则配置分类判断规则,同时需要关联该标准应用的数据库。[0024]本步骤需要制定各个最底层分类节点的判断规则,所述分类判断规则是分类信息和数据库字段产生映射的条件,即一种表字段和具体分类进行映射的条件。分类判断规则包括该分类所包含的敏感数据特征(姓名,身份证号码等)以及相关元数据的精确和模糊匹配。同时添加使用此规则的数据库。[0025]步骤3:授权扫描数据库,梳理缓存数据库内的敏感数据特征和元数据;[0026]本步骤主要用于提取数据模型特征和数据库元数据。通过扫描数据库获取非系统表的所有字段的抽样数据,同时对各个字段抽样数据进行预处理和正则判断形成可能的敏感数据特征(姓名,身份证号码等)并缓存,在此过程中也需要对数据库的元数据(表名、字段名称等)进行获取缓存。所述敏感数据特征是指一列数据的内容模型,该敏感数据特征是通过对数据库内每张表的字段内容进行部分抽样、预处理分析、正则判断形成的。[0027]步骤4:依据步骤2配置的分类判断规则和步骤3缓存的信息依次对每个字段进行分类分级判断;[0028]本步骤是数据分类分级的关键步骤。利用敏感数据特征和元数据对每个字段进行判断,判断过程是字段特征是否在当前分类规则包含的敏感数据特征范围内,字段名称是否匹配规则包含的字段名称或者是模糊匹配。如果满足以上任一条件则认定此字段属于当前分类。[0029]本发明在数据分类分级时,数据库和表的类别依赖于字段的类别。[0030]需要强调的是,本发明所述的实施例是说明性的,而不是限定性的,因此本发明包括并不限于具体实施方式中所述的实施例,凡是由本领域技术人员根据本发明的技术方案得出的其他实施方式,同样属于本发明保护的范围。4CN 108062484 A说 明 书 附 图1/1页图15
发布者:admin,转转请注明出处:http://www.yc00.com/news/1689765803a284372.html
评论列表(0条)