专家解读 | 蒋艳:促进数据标注能力提升,筑牢工业智能数据基础
2025-1-20 10:49:0 Author: mp.weixin.qq.com(查看原文) 阅读量:0 收藏

 扫码订阅《中国信息安全》

邮发代号 2-786

征订热线:010-82341063

文 | 国家工业信息安全发展研究中心主任 蒋艳
数据标注是对企业原始数据进行加工处理,形成可服务于人工智能模型训练、数据挖掘分析、开展检验检测等活动必须的高质量数据集的过程,主要包括筛选、清洗、分类、注释、标记、质检等环节。《关于促进数据标注产业高质量发展的实施意见》(以下简称《实施意见》)的出台,开启了我国数据标注产业高质量发展的崭新阶段。《实施意见》明确了一系列目标及举措,清晰界定了数据标注产业的范畴、发展方向、重点领域与核心任务,为培育数据标注新业态新模式、筑牢人工智能创新根基提供了路径指引。数据标注产业的繁荣将成为促进人工智能赋能新型工业化的关键力量。

01

坚持需求牵引,深入挖掘制造业企业数据标注需求

目前,我国制造业企业数字化普及率稳步提升,骨干企业基本实现智能化转型,数据规模和复杂度也逐渐增大,这为释放制造业企业数据要素价值带来了巨大的挑战。数据标注是衔接物理世界信息和数字世界应用的枢纽,是开发利用制造业海量数据、打通各系统环节数据孤岛、促进新一代信息技术与先进制造技术深度融合、实现数据技术双轮驱动的关键。
有效需求是拉动数据标注产业规模化发展,促进数据技术和制造业深度融合的强大动能。一方面,实施“国有企业数据效能提升行动”,以龙头国有企业为主体,打通产业生态内数据壁垒,促进数据归集汇聚,深入挖掘制造业数据应用场景,释放国有企业数据标注需求,支持一批规模化专业化数据标注服务商成长壮大。另一方面,加强重点制造业领域数据标注,打造制造业通用高质量数据集,服务制造业大模型训练和落地应用,推动人工智能大模型和制造业企业小模型结合,推动人工智能赋能新型工业化走深走实。

02

加强创新力度,精准服务制造业企业数据标注需求

创新是数据标注产业高质量发展的核心引擎,高端化发展是数据标注产业发展的方向。围绕核心技术攻关、标准体系完善和创新载体打造三方面重点发力,建立健全数据标注产业创新体系和生态,促进数据标注产业。
先进标注工具与技术的研发应用,是实现制造业多源数据融合驱动的技术基础。以国际前沿人工智能技术需求为导向,开展数据标注领域的关键技术攻关,加强跨模态语义对齐、4D标注、大模型标注等关键数据标注技术研发,加快研制先进自主可控的软硬一体标注设备,实现数据、模型、工具、系统和制造业场景等要素的融合,促进数据标注和制造业机理融合,对于深化人工智能在制造业的应用具有重要意义。
开展相关标准研制推广,推动与制造业先行标准的融合应用,是提升制造领域数据标注质量的关键。围绕数据标注的关键环节,结合制造业企业实际,引导数据标注企业和制造业企业共同开展标准研制,解决包括行业先验知识、数据安全保障、标注质量控制等关键核心问题,开展制造业数据集打造和质量提升行动,推动数据标注产业和制造业协同发展。
创新载体是实现制造业领域数据标注创新成果转化的重要平台。支持制造业企业联合数据标注产业链上下游企业、科研机构、高等院校等主体联合建立打造高水平创新载体,促进数据标注和制造业协同创新,培养具有制造业背景的高水平数据人才,加快科技成果转化和应用落地,鼓励有条件的制造业企业支持和参与开源生态建设,推动各类创新要素充分涌流。

03

深化产业融合,深度赋能制造业企业全链条智能化

数据标注是人工智能深入赋能新型工业化落地的重要环节,需要将数据标注与制造业关键环节深度融合,结合具体行业、场景、数据特点,开展数据标注模型设计。《实施意见》将有效推动数据标注服务和制造业需求精准匹配,打破数据标注环节的技术和能力限制,充分利用人工智能算法对制造业企业数据资源进行深度挖掘与分析,实现制造业关键环节的智能化变革。
(一)数据标注赋能创新研发
智能化研发设计通过结合人工智能算法、数据分析以及虚拟仿真技术,突破传统研发设计方法的局限。例如在制造业图纸自动生成场景,需结合相关行业机理,对图纸关键信息、关键节点、关键流程进行标记和注释;在三维结构智能生成场景,需对用于模型训练的图片数据、点云数据进行跨模态标注;在分子和药物智能研发场景,标注环节需结合相关知识,对原子、电荷、化学键、官能团、靶点、功能、活性等关键信息进行标记和对齐。
(二)数据标注赋能高效中试
中试验证环节在制造业中起着承上启下的关键作用,是工艺、设备、产品从设计概念走向大规模生产的重要验证环节,智能化技术在中试环节的应用主要集中在过程监测、产品质检、智能控制、系统仿真、机理研究等场景。例如在产品质检场景,需对图像、点云、深度等融合数据中体现的缺陷尺寸、位置、类型等信息进行标记和注释;在过程监测场景,需对中试对象各类传感器数据进行筛选、清洗、对齐,识别和标记异常信号。
(三)数据标注赋能敏捷生产
生产制造是制造业的核心环节,直接决定了制造业企业的效率、成本与效益,智能化应用空间较大。例如在设备预测性维护场景,需结合工业机理和经验,对生产设备运行数据进行融合标注,以精准捕捉设备潜在的故障信号;在智能过程控制场景,需对传感器、化验分析、控制器、人员等不同来源类型的数据进行筛选、清洗、对齐、标注等。此外,在制造业企业工业互联网、数智平台、边缘计算设备等中引入数据标注工具,将畅通从数据管理到人工智能应用的通路,重塑企业传统数据管理和应用模式。
(四)数据标注赋能智能营销
智能营销可实现客户群体精准定位、客户需求深度洞察、行为偏好模式识别等,打破传统营销服务的盲目性与局限性。例如在智能推荐场景,需结合推荐算法、模型的实际需求,对客户订单、行为数据等进行精确标记;在智能售后和智能客服场景,需收集和标注包括产品数据、检维修数据、客服业务数据、语音数据等在内的原始数据。
(五)数据标注赋能精益管理
智能化运营管理可实现企业供应链协同、生产调度、人力资源管理、财务管理等多个子系统的贯通,数据标注起到统一数据格式,打破系统壁垒的关键作用。例如在汽车制造智能供应链场景,零部件供应商与整车制造商等不同主体通过数据共享和协作标注,实现敏捷研发与生产;在市场智能预测场景,企业需对宏观市场数据进行趋势分析和准确标记,通过人工智能模型指导企业精益规划、研发、生产等,实现对市场需求的精准化掌握。
《实施意见》的发布为数据标注产业与制造业双向赋能,融合发展指明了方向,数据标注凭借其在精准数据支持、智能化决策、产业链协同、创新驱动以及质量控制等方面的重要作用,将成为推动智能制造产业蓬勃发展的关键力量,助力制造业企业在数字化时代实现转型升级与创新发展,迈向更高质量的发展阶段。

(来源:国家数据局网站)

分享网络安全知识 强化网络安全意识

欢迎关注《中国信息安全》杂志官方抖音号

《中国信息安全》杂志倾力推荐

“企业成长计划”

点击下图 了解详情


文章来源: https://mp.weixin.qq.com/s?__biz=MzA5MzE5MDAzOA==&mid=2664235156&idx=3&sn=558d06cf50feba02ada95b443dd3c827&chksm=8b58026dbc2f8b7b9eef3e6af4d43b30950f7189270bf1a2d3bca5bcca2741a0e8e19ea1ba22&scene=58&subscene=0#rd
如有侵权请联系:admin#unsafe.sh