国家档案局开展人工智能应用试点,探索建设通用档案大模型等
澎湃新闻 2026-04-21 08:48:46
4月20日,国家档案局官网刊发《国家档案局办公室关于开展人工智能应用试点工作的通知》(以下简称《通知》)称,为稳妥有序推进人工智能在档案行业应用,国家档案局决定组织开展人工智能应用试点工作。
此次试点目标为:聚焦落实国家“人工智能+”行动,以推动档案工作数字转型和智能升级为目标,试点探索算力、算法、数据、场景、安全、标准等方面内容,深入推进人工智能与档案业务深度融合,形成可复制、可推广的经验。
根据《通知》,试点任务包括五个方面:
探索建设区域算力中心或自建算力平台,采用成熟设备、主流架构推进人工智能基础设施建设,建立算力资源调度分配和动态调整管理机制,优先保障档案大模型训练、智能场景应用等需求;
探索建设通用档案大模型,构建模型应用工作机制和安全风险评测体系,强化模型选型与本地化部署研究,验证档案模型核心应用的科学性,形成基本路径建设、实践方式方法等方面的成果;
探索建设高质量档案数据集,加强数据整理与清洗标注,设计数据标注管理平台,完善数据质检,形成档案数据负样本集,构建小规模高质量训练与测试数据集,提高数据建设质量;
探索建设档案典型应用场景,应用人工智能技术深化已有应用场景,重点探索开创新业务场景。加强档案应用场景建设的规范性、实用性,通过档案应用场景带动档案业务数智化;
探索建设安全管控体系,研究档案数据应用、大模型训练、算法漏洞、伦理安全等方面的安全现状与实际需求,完善业务标准建设、技术应用可靠性验证、数据合规性监测管理、审计评估与应急响应机制建立等内容。
中央档案馆与国家档案局一个机构两块牌子,履行档案保管、利用和全国档案事业行政管理职能,为副部级,列入中共中央直属机关的下属机构序列。
稍早前,国家档案局官网4月10日刊发了《关于推进人工智能在档案行业应用的意见》(以下简称《意见》),明确了推进人工智能在档案行业应用的工作原则,就是稳妥探索应用、确保安全保密、突出重点培育、不搞一哄而上、注重实效节约。
其中,在推进人工智能应用方面,上述意见提出举措包括:一是加强档案数据基础建设,明确要求开展档案数字化成果等资源的文字、语音识别工作,推进档案资源数据化;深化数据标注,提高数据的可解释性、可用性;通过数据清洗等处理,提升数据质量,构建高质量档案数据集。二是明确典型场景牵引,提出以档案整理、档案著录、档案脱密脱敏、数据清洗、开放审核、档案编研、档案检索、专题库构建、影像档案修复、档案知识服务等典型场景为牵引,深化应用场景建设。三是强化算力支撑,鼓励创新人工智能基础设施共建共用新模式,建设智能算力基础设施,支持有条件的单位建设档案智能算力平台,向档案部门提供算力支持、模型训练、语料处理和推理研究等服务。
随后,国家档案局科技信息化司有关负责同志在答记者问时透露,该司考虑将坚持试点先行、典型带动策略,组织开展人工智能在档案行业应用试点工作,重点推动在算力、算法、数据、场景、安全、标准、规范等方面进行探索,力求取得实效。
责任编辑:韩雨婷
