2023年7月19日发(作者:)
数据治理⽅法论与相关⾯试题在前⼏年⼤数据发展的初期,各个公司都在风风⽕⽕地搞平台,搞数仓,接⼊各种数据,在那个阶段注重的是数据的存储和计算,慢慢地⼀年⼀年的数据积累下来,数据量⼤了之后⼈们开始关注质量的问题,这也是数据治理这个词这⼏年变得⾮常⽕的原因,平台那⼀套东西已经很成熟了,基本上即插即⽤,能满⾜⼤部分不太刁钻的需求了。所以,现在各个企业都会把保证平台的稳定,保证数据的⾼质量放在第⼀位,毕竟⽤于指导决策的数据是不容许出现⼤错误的,所以数据治理也就成了数仓建设⾮常重要的⼀个环节。本篇⾯试内容划重点:元数据管理、数据质量、数据安全。
元数据管理元数据即数据的数据,数据仓库的特点是数据种类多、数量⼤,相应的元数据也有很多,如果没有⼀个集中管理元数据的地⽅,在使⽤上会⾮常不便。元数据可以说是数据治理的基础,基于元数据我们还可以做很多的相关应⽤,⽐如⾎缘分析、数据资产地图、数据质量管理等等。元数据分为业务元数据、技术元数据和操作元数据,三者之间关系紧密。业务元数据指导技术元数据,技术元数据以业务元数据为参考进⾏设计,操作元数据为两者的管理提供⽀撑。业务元数据业务元数据是定义和业务相关数据的信息,⽤于辅助定位、理解及访问业务信息。业务元数据的范围主要包括指标名称、计算⼝径、业务术语解释、衍⽣指标等业务规则引擎的规则、数据质量检测规则、数据挖掘算法等数据的安全或敏感级别等技术元数据它可以分成结构性技术元数据和关联性技术元数据。结构性技术元数据提供了在信息技术的基础架构中对数据的说明,如数据的存放位置、数据的存储类型等;关联性技术元数据描述了数据之间的关联和数据在信息技术环境之中
发布者:admin,转转请注明出处:http://www.yc00.com/xiaochengxu/1689764839a284318.html
评论列表(0条)