听得懂“崂山话”的AI模型——对话标贝科技青岛公司负责人栾永乐
大众新闻 王瑛琪 2026-05-15 14:37:13原创
AI就像一个正在上学的孩子,大模型是大脑,机器人和自动驾驶是学以致用的技能,而我们做的,就是给这个孩子提供优质的课本和练习题。”标贝科技青岛公司负责人栾永乐说,“没有高质量数据,大模型就无法训练、无法落地,各类AI应用也会成为空中楼阁。”
标贝科技成立于2016年2月,是一家基于技术驱动的专业AI数据服务企业,业务覆盖语音、图像、视频、点云、文本、大模型、多模态等多个领域。基于自研一站式AI数据平台,标贝科技可以提供从数据采集、标注、管理,到模型训练优化、部署应用的全流程服务。
从北京中关村起步,到如今总部落在青岛崂山,标贝科技的路径也折射出人工智能企业从技术研发走向产业落地的趋势。
“选择青岛、选择崂山,不是偶然。”栾永乐说,山东是制造业大省,工业门类齐全,应用场景丰富,企业数字化、智能化转型需求旺盛;而青岛正在围绕人工智能、数据产业、算力服务等方向加快构建产业生态。对标贝而言,这里既有广阔的市场,也有真实复杂的产业场景。“AI数据服务最终要服务实体产业,离场景越近,越能解决真问题。”
今年4月,第八届数字中国建设峰会上,国家数据局发布首批数据标注优秀案例集,标贝科技自研的“4D-BEV上亿点云标注系统”成功入选,标贝科技成为青岛市唯一入围的企业。这套系统集成了自动化标注技术,深度兼容自动驾驶领域的4D-BEV感知算法,能从空间、时序两个维度对车辆、行人、路标等目标进行多视角标注,轻松处理上亿量级的点云数据,相比传统标注方式效率提升约30%、准确性提高约20%。
但点云标注只是标贝的一个切面。
“自动驾驶是AI数据服务的典型场景,制造业也是。”栾永乐说,“尤其在山东这样的制造业大省,人工智能要真正走进车间、产线和设备系统,首先要解决的不是‘有没有模型’,而是‘有没有适合这个工厂、这个行业、这个岗位的高质量数据’。”
针对山东制造企业普遍面临的数据少、标注难、成本高、合规风险大等痛点,标贝科技深入车间一线,定制采集语音、视觉、设备运行等真实数据,结合合成数据技术补充场景化数据集;通过自研AI数据平台叠加智能预标注,同时搭建可信数据空间,通过数据脱敏、私有化部署等方式保障全流程合规。
制造车间和办公室环境不同,环境嘈杂,还夹杂着大量的行业术语、工艺简称。针对嘈杂环境,标贝团队深入山东制造车间,采集机器轰鸣、人员嘈杂环境下的语音数据,通过降噪处理和模型优化,提升AI语音识别的抗干扰能力,确保嘈杂环境下识别准确率达99%以上。针对工业术语,团队梳理山东装备制造、化工、汽车零部件等行业的专属术语,将其纳入标注词典,定制术语标注规则,让AI精准识别行业专属表达。
但要让AI真正“听得懂山东工厂”,靠的不只是技术,还有方言。
“咱山东人都知道,青岛话很多发音和普通话差别还挺大,崂山话更是有自己的特点。此前,我们聚焦群众和相关部门需求,做了个‘崂山话’语音识别系统,使得老百姓尤其是老年人打电话咨询医保、社保问题时,智能客服就可以进行解答。”栾永乐说,“针对工厂场景,我们采集了山东各地市方言(如鲁西、胶东方言)的工业操作话术,组建了会山东方言的标注团队,优化语音识别模型,让AI既能听懂普通话,也能精准识别山东方言话术。”
落地效果是实打实的:标贝为山东汽车零部件企业定制的质检语音指令数据集,质检效率提升35%、人为误差降低80%;为装备制造企业搭建的AI故障诊断模型,故障预警准确率达98%、设备停机时间减少40%;为化工企业的高危场景定制的多模态数据集,支撑AI远程监控系统落地,生产效率提升25%,同时大幅降低安全风险。
(大众新闻记者 王瑛琪)
责任编辑:金雪
