让建站和SEO变得简单

让不懂建站的用户快速建站,让会建站的提高建站效率!

热点资讯
  • 元宇宙发展研究报告2.0版:应加大核心技
  • 西媒文章:体坛“Z一代”向老将们发起挑
  • 埃菲社评出:2021年欧洲新闻人物
公司资讯

详解数据治理相关的七个术语和名词

发布日期:2022-05-15 16:04    点击次数:117
一、数据元 1. 名词证明注解

国标[GB/T 18391.1—2002]对数据元的界说为:“用一组属性描摹界说、标识、示意和允许值的数据单元。”

数据元由三部分构成:对象、脾气和示意。数据元是构成实体数据的最小单元,或称原子数据。例如个人信息中,手机号为数据元,“135********”为数据元的值;性别为数据元,“男”和“女”为数据元的值。

2. 主要作用

算作最小颗粒度的数据,数据元是对数据进行步伐化界说的基础,亦然构建长入、集成、康健的行业数据模子的基础。

在企业数据治理中,数据元是需要步伐化的对象,一个数据元对象有且唯唯一个数据脾气,每个数据脾气对应一个数据示意。例如:人员的性别中的“男”是一个数据元对象,用数字“1”来示意。

3. 应用例如

数据元早期在金融、医疗等限度应用异常平庸,国度相关单元发布了对于数据元照应的一系列时间步伐和行业步伐,如《CFDAB/T 0301.3—2014食物药品监管信息基础数据元 第3部分:药品》。图1-1所示为食物药品监管信息基础数据元步伐。

▲图1-1 食物药品监管信息基础数据元步伐

二、元数据 1. 名词证明注解

元数据是描摹数据的数据或对于数据的结构化数据。

你是不是看了这个界说照旧稀里糊涂?那咱们来举个例子。一册书的封面和目次向咱们展示了这么的元数据信息:史籍称号、作家姓名、出书商和版权细节、史籍的提纲、标题、页码等。

2. 主要作用

在数据治理中,元数据是对数据的描摹,存储着数据的描摹信息。咱们不错通过元数据照应和检索咱们想要的“书”。可见元数据是用来描摹数据的数据,让数据更容易默契、查找、照应和使用。

3. 应用例如

元数据是业界公认的数据治理中的中枢成分,做好元数据照应,大意更容易地对数据进行检索、定位、照应和评估。用形而上学的思维默契元数据的话,元数据其实治理的是我是谁、我在那边、我从那边来、我要到那边去的问题。

元数据是建树数据仓库的基础,是构建企业数据资源全景视图的基础,明晰的血人缘析、影响分析、互异分析、关联分析、宗旨一致性分析等是数据财富照应的蹙迫一环。

要是说数据是物料,那么元数据便是仓库里的物料卡片;要是说数据是文献夹,那么元数据便是夹子的标签;要是说数据是书,那么元数据便是藏书楼中的史籍卡。

三、主数据 1. 名词证明注解

主数据是企业内需要在多个部门、多个信息系统之间分享的数据,如客户、供应商、组织、人员、名堂、物料等。与记载业务活动、波动较大的交往数据比较,主数据(也称“基准数据”)变化较慢。主数据是企业开展业务的基础,唯独得到正确调理,才能保证业务系统的参照完美性。

主数据具有3大脾气、4个特出。

3大脾气:高价值性、高分享性、相对康健性。

4个特出:特出业务,特出部门,特出系统,特出时间。

2. 主要作用

在数据治理中,主数据用来治理企业异构系统之间中枢数据不一致、不正确、不完美等问题。主数据是信息系统建树和大数据分析的基础,被以为是企业数字化转型的基石。

3. 应用例如

不同行业、不同限度的主数据的内容不同。例如:在制造型企业中,中枢主数据有物料、BOM、开荒、客户、供应商、人员等;在金融行业中,客户、客户关系是主数据照应的中枢;在政府各部门,生齿、法人、证照等是主要的主数据。

四、业务数据 1. 名词证明注解

业务数据是业务活动经由或系统自动产生的既定事实的数据,也称交往数据。业务数据来自三个方面。

第一,业务交往经由中产生的数据,例如打算单、销售单、坐蓐单、采购单等,这类数据大都是手动生成的。

第二,系统产生的数据,包括硬件开动情状、软件开动情状、资源消费情状、应用使用情状、接口调用情状、就业健康情状等。

第三,自动化开荒所产生的数据,如各样物联网开荒的开动数据、坐蓐蚁合数据等。

岂论源自何处,业务数据的共同特质是:时效性强,数据量大。

2. 主要作用

业务数据主要面向应用,为业务应用提供就业,例如坐蓐、销售、采购、开荒照应、系统照应等。

3. 应用例如

表1-1是某企业的产物销售记载,这是一种异常蹙迫的业务数据。

▼表1-1 某企业的产物销售记载

五、主题数据 1. 名词证明注解

主题数据是阐发数据分析的需要,按照业务主题对数据所做的一种组织和照应风光,其内容是为了进行面向主题的分析或加快主题应用的数据。

主题数据是分析型数据,是按照一定的业务主题域组织的,就业于人们在决策时所关怀的要点方面。一个主题数据不错由多个主数据和交往数据构成。主题数据一般是汇总的、弗成更新的、用于读的数据。

2. 主要作用

主题数据是按照一定的业务主题域组织的,就业于各式数据分析或应用开发。

3. 应用例如

主题数据与行业或限度有较大的关系,不同行业关注的主题是不同样的。即使是兼并排业,不同企业也有不同的主题数据界说。

例如,某坐蓐制造企业界说了12大主题数据,包括空洞就业、人力资源、财务照应、质料照应、坐蓐照应、工艺照应、库存照应、销售照应、采购照应、开荒照应、动力照应和安全环保。

六、数据仓库 1. 名词证明注解

数据仓库(Data Warehouse,DW)是一个面向主题的、集成的、相对康健的、反馈历史变化的数据迫临,用于维持照应决策。数据仓库是数据库的一种宗旨上的升级,不错说是为满足新需求而联想的一种新数据库,需要容纳愈加浩大的数据集。内容上,数据仓库与数据库并莫得什么离别。

2. 主要作用

数据仓库是为企业扫数级别的决策制定经由提供扫数类型数据撑持的计策迫临,有以下三个主要作用。

数据仓库是对企业数据的聚集和集成,数据仓库内的数据开端于不同的业务处理系统,包含主数据和业务数据。数据仓库的作用便是匡助咱们诓骗这些难得的数据做出最聪慧的交易决策。

数据仓库维持多维分析。多维分析通过把一个实体的属性界说成维度,使用户能便捷地从多个维度汇总、狡计数据,增强了用户的数据分析处理智力,而通过对不同维度数据的比较和分析,用户的数据处理智力得到进一步增强。

数据仓库是数据挖掘时间的要道和基础。数据挖掘时间是在已出奇据的基础上,匡助用户默契现存的信息,并对改日的企业情状做出展望。在数据仓库的基础上进行数据挖掘,不错对扫数这个词企业的发展情状和改日远景做出较为完美、合理、准确的分析和展望。

3. 应用例如

数据仓库是数据分析和数据可视化的基础,通过将来自不同行务系统的数据蚁合到一道,并按照一定的主题进行编号、归类、分组,便捷用户快速定位数据源,为数据分析提供撑持。

为了提高数据仓库的数据质料,确保数据分析的准确性,数据仓库的建树需要践诺数据治理的策略。好多企业的数据治理名堂践诺的动因都是治理数据仓库中的数据质料问题,以便取得更准确的分析决策。

七、数据湖 1. 名词证明注解

阐发维基百科的界说,数据湖是一个以原始体式存储数据的存储库或系统。它按原样存储数据,而不消预先对数据进行结构化处理。数据湖不错存储结构化数据(如关系型数据库中的表)、半结构化数据(如CSV、日记、XML、JSON)、非结构化数据(如电子邮件、文档、PDF)和二进制数据(如图形、音频、视频)。

数据湖不错更便捷、以更低的资本治理不同数据结构的长入存储问题,同期还大意为机器学习提供全局数据。咱们不错将数据湖默契为一个交融了大数据集成、存储、处理、机器学习、数据挖掘的治理有打算。

2. 主要作用

对于数据湖的作用,AWS将它与数据仓库进行了类比,如表1-2所示。

▼表1-2 来自AWS的数据湖与数据仓库的对比

3. 应用例如

数据湖不是一个产物或用具,它是交融了数据蚁合、数据处理、数据存储、机器学习、数据挖掘等时间和用具的治理有打算。数据湖维持处理不同类型的数据和分析要领,以取得更深档次的洞见所必需的彭胀性、敏捷性和天真性。亚马逊AWS、Informatica、阿里云、华为云、用友等都推出了数据湖治理有打算。

数据湖的出现给数据治理带来了一定的挑战。数据湖将数据全部聚会存储,那数据治理是在“湖中”治理照旧在“湖外”治理,这是个需要企业筹商和探索的问题。

对于作家:罗小江,用友集团助理总裁、平台和数据智能处事部总司理、北京软件和信息就业业协会云狡计专委会副会长、中国企业财务照应协会企业风险管控专科委员会副主任委员。专注于企业数字化平台时间应用筹商,具有企业照应、IT等复合常识,况兼有丰富的践诺寄托训戒,主导过多个千万级名堂的打算及联想使命。

石秀峰,用友集团数据治理人人、中国电子商会数据资源就业翻新专科委员会受聘人人、数据质料管平稳清闲库(DQPro)受聘人人。深耕数据限度十余年,曾主导过多家大型集团的数据治理、数据集成等名堂的策划和落地。

本文摘编自《一册书讲透数据治理:计策、要领、用具与本质》,经出书方授权发布。(ISBN:9787111694489)

 



上一篇:剑指“黑医美” ,浙江出台省级医疗美容期间圭表
下一篇:HUAWEI WATCH FIT文静款名扬国际 知名衣着分析师连发三条推特夸赞