目前业界并没有对其概念的统一标准定义,我们可以这么认为,数据治理从本质上看就是对一个机构(企业或政府部门)的数据从收集融合到分析管理和利用进行评估、指导和监督(EDM)的过程, 通过提供不断创新的数据服务, 为企业创造价值。
DGI(Data Governance Institute,数据治理研究所)认为,企业不仅需要管理数据的系统,更需要一个完整的规则系统以及规章流程。数据治理基本上涵盖了企业所有与数据有关的内容,因此在整个企业范围内,包括工作流程、涉及人员和使用的技术等等,都需要经过仔细考量,以保证数据的可用性、一致性、完整性、合规性、和安全性,确保在整个数据生命周期中,都具有较高的数据质量。
总体来说,数据治理的目标就是提高数据质量,将数据价值最大化。具体而言,数据治理的任务包括以下几点:
构筑适配灵活、标准化、模块化的多源异构数据资源接入体系;
建设规范化、流程化、智能化的数据处理体系;
打造数据精细化治理体系、组织的数据资源融合分类体系;
构建统一调度、精准服务、安全可用的信息共享服务体系。
分析机构BARC在一项研究中对全球378家公司进行了调查,96%的受访企业认为,数据治理已经不可或缺,而且未来将继续在企业中发挥核心作用。调查显示,合规性(64%)、更有效地使用数据(54%),以及与业务相关的内部和外部数据的不断增加(54%)是企业制定数据治理计划的主要驱动因素。
企业如果缺乏有效的数据治理策略,最直接的,将产生大量的“劣质”数据,这些数据的存在可能会带来更大的风险,更高的管理成本,更低的工作效率等等。甚至于,在数据分析如此盛行的当下,劣质数据将对企业决策产生消极的影响——错误的数据,得到错误的结果。
制定良好的数据治理计划,所带来的优势是非常显著的,主要有:
企业将获得更干净、质量更高的数据,为进一步的数据活动打好基础
标准化的数据资产管理方法、流程和策略,将有效提高数据运营效率
使数据更容易与业务建立紧密连系,推动数据资产的变现
提高数据安全性,保证合规性
总体来说,数据治理能够带来的好处就在于,更高效地帮助企业将数据价值转化成实际的业务价值。
数据“井喷”仍在进行,机器学习、AI等这类十分依赖数据质量的技术持续火热,全球数字化转型浪潮也在全面推进,由此可见,数据治理未来将继续在组织的数字战略计划中占有重要地位。
数据治理、数据管理、数据管控这三个名词在一定程度上的确是有所重叠的,容易混为一谈,所以就造成了在实际使用中,经常将这三个词语“混着用”、“随机用”的现象。
有关数据治理、数据管理区别的讨论有很多,有人认为数据治理是包含在数据管理中的,数据管理的范围要更广,例如:在DAMA-DMBOK中就明确提出数据管理包含数据治理;也有人认为数据治理要高于数据管理,是企业顶层上的策略。
笔者认为以上两个观点都没有错,如果要用一个模型来描述数据治理、数据管理、数据管控这三个名词,那应该是一个“金字塔”模型。
最顶层的应该是数据治理。与“治理”相关,我们还会经常看到、听到国家治理、公司治理的概念,从某种意义上讲,治理是一种自顶向下的策略或活动。如果我们将国家治理说成国家管理,把公司治理说成公司管控是不是有点怪怪的?
因此,数据治理应该是企业顶层设计、战略规划方面的内容,是数据管理活动的总纲和指导,指明数据管理过程中哪些决策要被制定,以及由“谁”来负责,更强调组织模式、职责分工和标准规范。
数据管理是为实现数据和信息资产价值的获取、控制、保护、交付以及提升,对政策、实践和项目所做的计划、执行和监督。这个是DAMA-DMBOK中关于数据管理的定义。
笔者理解数据管理是实现数据治理提出的决策并给予反馈,强调管理流程和制度,涵盖不同的管理领域,诸如:元数据管理、主数据管理、数据标准管理、数据质量管理、数据安全管理、数据认责管理、数据服务管理等。
数据管控更多的是执行层面,是具体的如何落地执行所涉及的各种措施,例如:数据建模、数据抽取、数据处理、数据加工、数据分析等,数据管控是确保数据被管理和监控,从而让数据得到更好的利用。
因此,数据治理强调顶层的策略,管理是侧重于流程和机制,管控是具体的措施和手段,三者应该是相辅相成的。而如今我们听到的更多的“数据治理”这个词,似乎只要涉及数据管理的,都在说自己在搞数据治理。
出现这个问题,主要是企业越来越意识到传统IT驱动或者说技术驱动的专项数据管理项目,在实施过程中很难推进、困难重重,并且很难解决业务和管理上的用数难的问题。而从战略、组织入手的数据治理顶层设计,更有利于推动数据管理目标的实现。