从“看见”到“看懂”:极视角星际视觉语言大模型打开工业视觉新空间
大众新闻 王嘉一 2026-03-13 12:19:55原创
在工业生产现场,AI视觉系统早已得到广泛应用。从安全监管到设备巡检,从流程监控到质量检测,越来越多企业开始借助机器视觉感知生产现场。但在实际应用中,传统视觉模型仍面临细粒度目标感知能力有限、复杂场景理解不足等问题,同时往往需要反复进行数据标注和模型训练,应用部署与迁移效率也受到限制。
针对这些问题,山东极视角科技股份有限公司推出了自研的星际视觉语言大模型,并将其定位为产业智能化升级的AI视觉新引擎。

与传统视觉模型相比,星际视觉语言大模型的重要变化在于,它不仅具备视觉感知能力,也融合了视觉理解能力。依托极视角十年的AI视觉技术积累和产业经验,该模型整合10亿+真实业务数据集,采用多模态融合架构,将视觉感知与语言理解技术结合起来,构建了“可描述即可定位”的视觉认知体系。
具体来看,用户只需通过自然语言描述目标或场景,模型即可完成目标检测与定位,并支持快速生成定制化识别能力。视觉系统因此不再局限于预设类别的识别,而能够根据任务描述,在不同场景中完成更灵活的识别与分析。
根据官方介绍,星际视觉语言大模型在超过80%的视觉感知场景中无需重新进行数据标注和模型训练,即可满足目标检测和定位需求,从而提升AI能力在实际业务中的落地效率。

从技术架构看,星际视觉语言大模型采用统一视觉编码、目标框Token化和模块化设计,并构建了云端、本地部署和边端轻量化部署的多种形态。模型能够通过任意词汇指令检测并定位目标,也能够理解并执行复杂自然语言指令,实现智能视觉解析,推动视觉系统从“视觉感知”向“业务认知”升级。
目前,该模型已成为行业首批同步支持短语描述和文本描述的多模态端侧视觉解决方案之一,其全栈视觉定位技术可实现像素级空间解析精度。
围绕星际视觉语言大模型,极视角还构建了一整套工业大模型解决方案。通过大模型平台体系,企业可以完成从资源调度、数据集建设、智能标注、模型仓库、模型训练与微调、模型评测到在线推理、智能体开发等全链路流程,形成大模型开发与应用的完整体系。
从应用场景看,该方案已覆盖汽车、轨道交通、采矿、冶金、食品制造等多个工业领域,重点应用于安全监管、SOP流程管理、工业巡检、设备运维等核心环节。
整体来看,星际视觉语言大模型体现了工业视觉能力从“看见”向“看懂”升级的方向,为工业场景智能化发展提供了新的技术支撑。
(大众新闻记者 王嘉一)
责任编辑:叶彤
