一. 数据要素
1.1
数据要素大事记
近年来,数据从一种新兴资源被逐步确立为关键生产要素,经历了从概念提出到政策落地的一系列重要节点。以下这些大事件,清晰勾勒出我国数据要素化发展的路径:
• 2019年11月,党的十九届四中全会《决定》首次公开提出“数据可作为生产要素按贡献参与分配”;
• 2020年4月,中共中央、国务院发布《关于构建更加完善的要素市场化配置体制机制的意见》;
• 2021年3月,国家发改委发布《全国一体化大数据中心协同创新体系算力枢纽实施方法》,提出建设“东数西算”工程;
• 2022年12月,中共中央、国务院发布《关于构建数据基础制度更好发挥数据要素作用的意见》(也称“数据二十条”),明确数据基础制度体系;
• 2023年3月,中共中央、国务院印发《党和国家机构改革方案》,提出组建国家数据局;
• 2023年8月,财政部发布《企业数据资源相关会计处理暂行规定》,数据入表成为可能;
• 2023年10月,国家数据局正式揭牌;
• 2023年12月,国家数据局等17部门联合印发《“数据要素×”三年行动计划(2024—2026年)》;
• 2024年3月,国家网信办出台《促进和规范数据跨境流动规定》;
• 2024年5月,24家数据交易机构联合发布《数据交易机构互认互通倡议》;
• 2024年7月,党的二十届三中全会《决定》提出“建设和运营国家数据基础设施,促进数据共享”;
• 2024年11月,国家数据局发布《可信数据空间发展行动计划(2024—2028年)》和《国家数据基础设施建设指引》征求意见稿;
从这些里程碑事件中可以看出,数据作为生产要素的地位正在被不断强化;同时,围绕数据要素的基础设施建设、政策制度设计与市场运作机制也在稳步推进。
1.2
数据何以成为要素
不同于传统的土地、劳动力和资本,如表1所示,数据作为新时代的新生产要素具有其独特性。这些特征决定了数据不同于传统生产要素的应用方式,决定了数据要素具备乘数效应,也为其在经济活动中的广泛赋能奠定了基础。
表1:数据的独特特征
如图1所示,数据要素的价值释放过程不同于传统生产要素,它不仅体现在数据本身的价值,还通过与其他要素的结合,在经济循环中展现出强大的乘数效应。从理论上来看,数据要素的乘数效应主要通过“协同”、“复用”和“融合”三种赋能机理实现。这三种机理代表了数据在应用范围上的扩展和应用深度上的提升,推动了产业数字化和智能化的持续进步。
图1:数据要素具备乘数效应
1) 协同:多要素协同,提升系统整体效率
协同是数据要素价值释放的基础机理,通过数据与其他要素的结合,推动资源的高效配置和系统整体效率的提升。协同效应可以分为以下三个层次:
业务协同:数据打通企业内部不同业务模块,使各部门之间的信息共享更加通畅,提升运营效率。例如,通过实时销售数据与库存管理的整合,企业可以实现精准的供应链管理,减少库存积压。
主体协同:数据促进不同主体之间的协作,推动产业链上下游的深度融合。例如,在制造业中,供应商与制造商通过共享生产数据,可以共同优化产品设计和生产流程。
要素协同:这是数据要素独特的价值体现,通过与其他生产要素(如劳动力、资本)的结合,激发新的生产力。例如,数据与劳动力结合可以降低培训成本,通过虚拟仿真技术实现知识和技能的快速迁移。
2) 复用:一次生成,多次使用,释放跨领域价值
复用是数据要素区别于传统要素的核心特性之一。由于数据具备非损耗性和低复制成本,数据可以在不同场景、主体和领域之间反复利用,从而大幅降低边际成本,并催生出新产品、新服务和新模式。
跨主体复用:同一组数据可以在不同主体间共享使用。例如,制造业中的工艺数据不仅能帮助企业优化自身生产流程,还能为供应链上下游企业提供技术支持,改善产品质量。
跨领域复用:数据在不同领域之间的共享和应用可以创造额外价值。例如,医疗健康数据不仅可以用于临床诊断,还能支持药物研发和保险产品设计。
跨场景复用:数据在不同场景下的多次使用可以实现更广泛的价值释放。例如,交通数据既可以用于优化城市交通规划,又能为智能驾驶提供支持。
3) 融合:数据规模与品类的叠加催生新能力
融合是数据乘数效应的高级阶段,通过数据规模的扩展和品类的丰富,推动质变的发生。融合效应强调多主体参与下的数据汇聚与协作,形成规模经济和范围经济的双重效应。这不仅会催生新能力,还会创造全新的产业模式。
规模驱动效应:数据量的积累能够推动生产效率的提升。例如,工业互联网平台通过汇聚海量设备数据,能够进行更精细的预测性维护,大幅减少设备故障停机时间。
创新驱动效应:数据规模和品类的增长为新技术的应用提供了支撑。例如,人工智能大模型的“涌现能力”依赖于数据规模和多样性的突破。只有当模型训练数据达到临界点时,AI才能展现出新的能力,如复杂的自然语言理解和生成。
二 数据要素开发的非平凡性
尽管数据要素具备巨大价值潜力,但其开发和利用却面临诸多独特挑战。这些挑战本质上同样源于数据的固有属性[1],如图2所示:
图2:数据要素化治理的必要性
成本性:数据的采集、存储、处理乃至安全保护都需要资源投入,而非完全没有成本;
可复制性:数据的在开发利用过程的各个环节均可能因为复制行为导致复制版本的存在,这将损害数据资源的稀缺性;
多粒度性:数据具备可分割性(把逻辑上是统一整体的数据分割成较小的、可以独立管理的物理单元进行存储、分析和使用)和可融合性(将多个数据资源的数据和信息相结合,以实现比单独使用单个数据资源所能实现的更高的准确性和更具体的推论,从而获得更高的价值),这使数据资源的独创性判定便得困难,尤其是在开发利用过程中,数据资源的溯源变得极其困难;
风险外溢性:数据的可复制性导致多个参与和在其各自参与的环节都会不同程度地获得数据资源的复制版本;数据的多粒度性导致各个参与者在各自参与的环节均可以对数据资源进行处理,包括分割或者融合等操作。这给恶意篡改与滥用带来空间,容易造成不可控的风险外溢;
可替代性:同一个目的,可以通过不同类型和不同来源的数据资源实现;针对同一数据对象或者同一类信息,也可以通过不同途径进行收集;
价值后验性:数据交易中数据资源具备典型的事前不确定性,即对于数据资源所包含的信息,买方不能也不应该事前完全了解;同时,数据最终能带来的收益会受到各类其它因素的影响,而这些也很难完全预料;
价值分配不对称性:数据资源的价值后验性和可替代性使得数据资源的生产者在数据资源价值分配中处于弱势地位,同时数据资源的价值并不能直接体现出来,而是需要完成整个价值链之后才能实现。而数据资源的开发利用过程必然会涉及多个跨域主体。这些主体相互影响,相互依赖,对分配过程具有不同的决策能力,带来了分配主体的不确定性,以至难以有效平衡不同主体的利益、难以做到公平分配
因此,数据要素开发需要精心设计的治理机制,以确保数据价值在流通过程中高效、安全地释放。
三 国家数据基础设施与可信数据空间
3.1
国家数据基础设施
为充分释放数据要素价值,国家数据局提出建设国家数据基础设施,这也可以视为数据要素化治理的国家级方案。国家数据局刘烈宏指出[2],数据基础设施是从数据要素价值释放的角度出发,在网络、算力等设施的支持下,面向社会提供一体化数据汇聚、处理、流通、应用、运营、安全保障服务的一类新型基础设施,是覆盖硬件、软件、开源协议、标准规范、机制设计等在内的有机整体。
简单地说,国家数据基础设施的核心目标是为数据要素的高效利用提供底层支撑。如图3所示[3],国家数据基础设施可以从纵向“基础设施形态”和横向“数据全生命周期”两个维度来理解。
图3:国家数据基础设施
下面对纵向的基础设施形态进行简要介绍:
国家软基础设施:涵盖数据标准、算法模型、互操作协议等,用于确保数据流通的规范化和高效性;
国家硬基础设施:包括数据中心、算力枢纽、边缘计算节点等,为数据的存储和处理提供物理支撑;
国家数据安全基础设施:贯穿数据全生命周期与全流通路径,确保数据的安全性和合规性的技术与平台等;
可以发现,国家数据基础设施具备如下特点:
全面继承性:国家数据基础设施是对数据要素化发展阶段的新型基础设施,是在以前信息化阶段的信息基础设施和数字化阶段的数字基础设施上发展起来的;
鲜明创新性:国家数据基础设施不仅全面继承了信息和数字基础设施,而且在数据要素化发展新阶段,创新发展出国家软基础设施和国家数据空间等新型基础设施;
广泛覆盖性:覆盖数据采存算管用数据全生命周期各环节,对数据采集、汇聚、加工、共享、开放、运营、交易、存储等业务形成全面支撑,并形成国家数据资源平台、国家政务数据共享交换平台等各类新型国家数据基础设施;
3.2
可信数据空间
在构建国家数据基础设施时,除了底层的网络、算力等标准化支撑,更需要能落地的业务场景和管理功能,并最终转化为实体化的解决方案。换句话说,国家数据基础设施的目标不仅仅是技术层面的支撑体系,还需要实现“可视化”“可操作化”的结果,让普通用户、企业、政府等主体都能便捷接入并受益。笔者以为,正是这些需求催生了“可信数据空间”建设。
官方定义而言,可信数据空间是基于共识规则,联接多方主体,实现数据资源共享共用的一种数据流通利用基础设施;从实践的角度来看,笔者以为,可信数据空间是国家数据基础设施的一种实例化对象,它不仅是一个物理或虚拟的空间,更是围绕特定场景构建的完整数据服务体系。每个可信数据空间都有其独特的功能和应用场景,但同时也必须满足以下基本要求:
全生命周期安全:可信数据空间必须确保数据从采集、存储、处理到流通、应用的全过程安全。这不仅包括技术层面的加密、隐私保护,还涉及到数据治理和合规的机制设计。
软、硬、安全基础设施协同:可信数据空间需要将数据软基础设施(如标准、算法)与硬基础设施(如数据中心、算力节点)以及安全基础设施(如隐私计算、数据访问控制)进行深度整合,形成端到端的解决方案。
多主体协作:可信数据空间的建设需要多方利益相关者的广泛参与,如企业、行业、城市乃至跨境主体等。这种多主体协作既是建设的难点,也是可信数据空间释放价值的重要来源。
更具体的,在国家数据局发布的《可信数据空间发展行动计划(2024—2028 年)》中,对可信数据空间的未来发展做出了明确的规划:
总体目标:到 2028 年,可信数据空间在运营、技术、生态、标准、安全等方面实现突破,建成 100 个以上可信数据空间。
五大方向:
积极推广企业可信数据空间:⽀持国有企业和⻰头企业建设企业可信数据空间,构建多⽅互信的数据流通利⽤环境,协同上下游企业开放共享⾼质量数据资源,打造数字化供应链,提⾼计划、采购、⽣产、交付、运维等全流程协同效率。
重点培育行业可信数据空间:⽀持建设重点⾏业可信数据空间,创新共建共治共享的数据使⽤、收益分配、协同治理等机制,促进产业链端到端数据流通共享利⽤,⽀撑⼈⼯智能⾏业模型跨域研发应⽤,推动产业链由链式关系向⽹状⽣态转变。
鼓励创建城市可信数据空间:⽀持有条件的地区开展城市可信数据空间建设,围绕城市规划建设、交通出⾏规划、医疗健康管理、重点⼈群服务保障、⽣态保护修护等典型场景,发挥公共数据资源的引领作⽤,推动公共数据、企业数据、个⼈数据融合应⽤,构建城市数据资源体系,⽀撑城市建设、运营、治理体制改⾰。
稳慎探索个人可信数据空间:研究制定个⼈数据开发利⽤政策⽂件,在切实保护个⼈数据合法权益的基础上,建⽴健全个⼈数据确权授权和合规利⽤机制。
探索构建跨境可信数据空间:建⽴⾼效便利安全的数据跨境流动机制,⽀持⾃由贸易试验区出台实施数据出境管理清单(负⾯清单),构建数据跨境传递监控、存证备案、出境管控等能⼒体系。
可信数据空间的建设,不仅是技术层面的创新,更是数据治理、商业模式和生态体系的深刻变革。它将推动数据从资源向生产要素的全面转化,为数字经济的发展注入强劲动能。
四 总结
本文回顾了数据要素化发展的重要历程,探讨了数据要素利用的复杂性,并介绍了国家数据基础设施与可信数据空间的建设思路。随着数据要素价值的不断释放和可信数据空间的快速推进,中国正逐步构建以数据为中心的经济新生态。未来,可信数据空间将成为数据要素市场化的基石,为数字经济的高质量发展注入强劲动能,也是所有数据安全研究与实践者不可错过的新领域。
参考文献
[1]:杜小勇, 黄科满, 卢卫. 跨域数据治理[M]. 北京: 中国人民大学出版社, 2024.
[2]: https://zfsg.gd.gov.cn/xxfb/ywsd/content/post_4294473.html
[3]: https://www.cnblogs.com/johnnyzen/p/18065846
内容编辑:创新研究院 顾奇
责任编辑:创新研究院 陈佛忠
本公众号原创文章仅代表作者观点,不代表绿盟科技立场。所有原创内容版权均属绿盟科技研究通讯。未经授权,严禁任何媒体以及微信公众号复制、转载、摘编或以其他方式使用,转载须注明来自绿盟科技研究通讯并附上本文链接。
关于我们
绿盟科技研究通讯由绿盟科技创新研究院负责运营,绿盟科技创新研究院是绿盟科技的前沿技术研究部门,包括星云实验室、天枢实验室和孵化中心。团队成员由来自清华、北大、哈工大、中科院、北邮等多所重点院校的博士和硕士组成。
绿盟科技创新研究院作为“中关村科技园区海淀园博士后工作站分站”的重要培养单位之一,与清华大学进行博士后联合培养,科研成果已涵盖各类国家课题项目、国家专利、国家标准、高水平学术论文、出版专业书籍等。
我们持续探索信息安全领域的前沿学术方向,从实践出发,结合公司资源和先进技术,实现概念级的原型系统,进而交付产品线孵化产品并创造巨大的经济价值。
长按上方二维码,即可关注我