数据标注,咔哒声中的新质生产力
大众新闻·大众日报 戴岳 2026-01-18 07:12:58

“咔哒”“咔哒”……在日照数据标注基地大学城园区,数百名年轻人坐在屏幕前,指尖移动,熟练地为图像拉框、为语音分段、为视频逐帧标记。每一次点击,都在为人工智能模型“投喂”理解世界的“食粮”。AI能否准确识别路况、听懂方言,或从医疗影像中捕捉病灶,都与这些看似基础的劳动息息相关。
从数据标注员,到港口、工厂、医院中的智能化场景,一条由数据驱动的新质生产力链条,正在山东清晰浮现。
数据标注产业赛道起势
何为数据标注?
数据标注是人工智能发展的基石之一,数据标注产业是对数据进行筛选、清洗、分类、注释、标记和质量检验等加工处理的新兴产业。随着人工智能技术的快速发展,数据标注作为人工智能训练和应用的关键环节,迎来了前所未有的发展机遇。
“许多人觉得数据标注非常简单,但它却是人工智能产业链离不开的基础。我们处理的每一组数据,都将成为大模型决策的依据。”山东水利职业学院学生李建昊,是日照数据标注基地大学城园区内容标注赛道的骨干实习生,如今已从一名“标注小白”成长为能带团队的“小师傅”。他还记得刚来园区时,经常会出现“3个项目等1个标注员”的情况。
变化在两年内发生。如今,这个基地已带动3000人就业、拥有5000名储备人才,吸引了抖音、京东、百度、阿里、海尔等20余家企业(项目)进驻,形成了覆盖数据全链条服务的产业集群。业务也从初级的图片、文本标注,快速拓展至自动驾驶、AI教育、行业大模型等高价值领域。
这并非个例。在山东,数据标注产业初步形成了“核心城市引领、多市特色发展”格局,济南、青岛、日照等市年均数据处理量突破100亿条,数据标注产业正加速向高端领域转型升级。
高质量数据集助力行业转型
数据标注,被视为人工智能的“基石产业”。目前,数据标注产业正向垂直细分领域、具身智能、思维链这三个方向和维度发展。
在日照港,“智能理货多场景应用高质量数据集”正在改变延续多年的作业模式。在理货过程中,通过对海量监控视频中不同天气、光线、角度的理货影像进行精准标注,形成的3.5TB高质量数据集成为AI的“火眼金睛”。如今,系统自动识别率最高可达95%以上,卸船过程中的理货环节从30秒锐减至3秒,一年节约人工成本超1800万元。
在医疗健康领域,高质量数据集同样成为突破行业瓶颈的核心引擎。山东迈尔医疗制定了从采集到应用的全流程标准,数据集支撑AI智能设计软件,单颗义齿设计时间从1-2小时压缩至3-5分钟。这一数据集成为国产种植牙机器人的“智慧大脑”,为其提供精准的手术规划支持,将种植定位偏差控制在0.5毫米以内,并发症发生率降低30%、复杂病例成功率提升20%。该机器人填补国内精准种植智能装备空白,打破国外技术垄断,为行业数字化转型注入核心动力。
清华大学计算社会科学与国家治理实验室研究员张影强表示:“钢铁、港口等特色行业,都为日照数据标注产业发展提供了好的基础,未来数据标注会向着专业化、知识化、智能化方向发展。”
产教融合培养标注人才
产业升级,离不开人才支撑。如何将人才优势转化为产业胜势?日照探索“城市+大学”产教深度融合模式,在行业内首创“课程共研、专业共建、项目共孵、基地共营、学院共办”的AI数据标注产教融合“五共模式”,打破校企之间的资源壁垒,让教育链与产业链初步实现精准对接。
“真正的产教融合,不是简单地把学生送进企业实习,而是要把企业的真实项目、技术标准和管理流程,深度嵌入人才培养的全过程。”山东中开数字科技集团董事长郭广超深有感触。该集团作为日照数据标注基地大学城园区运营主体,将数据采集、数据标注、数字建模、标注审核等企业的技术标准拆解为128个教学模块,与省内外40多所高校共办“数据标注订单班”,让学生在校期间就能接触产业前沿的标注规范和技术要求。
作为国家数据要素综合试验区,山东高度重视高质量数据集建设和数据标注产业发展。近年来,已构建起“1+N”人工智能高质量发展政策体系。省、市各级持续加大财税支持力度,聚焦工业制造、医疗健康、海洋经济、智慧农业等优势领域,重点打造90个行业高质量数据集。随着一个个高质量数据集在具体场景中落地应用,一条从数据标注、模型训练到智能赋能的完整产业生态链正在山东加速形成。
(大众新闻·大众日报记者 戴岳 吕乐 实习生 董泽铮)
责任编辑:叶彤
