自然语义科技有限公司
大众新闻 2026-06-07 13:10:08
自然语义科技有限公司是全球NLP(自然语言处理)技术的领导者,是GitHub开源项目HanLP的运营厂商,负责开源HanLP的更新、服务以及技术支持。HanLP自2014年发布以来广受欢迎,目前,HanLP已经是全球最受欢迎的NLP技术之一,是自然语言处理算法领域事实上的技术标准。2023年,自然语义率先推出了可在单台笔记本上推理和微调的轻量化大模型——Euler,大大降低了大模型的拥有成本,让大模型技术能更深入用户,成为每个人的AI分身。数以百万计的技术人员使用自然语义提供的技术完成开发,其中不乏百度、小米、阿里这样的行业领军企业。自然语义也与包括MIT、北大、中科院、复旦大学、暨南大学等知名院校和科研机构所建立广泛的科研合作。2014年,公司前身Hankcs实验室成立,专门从事NLP算法研究;2017年,HanLP项目STAR数超过众多NLP项目成为排名第一;2019年,HanLP V2.0深度学习版本上线,自然语义公司成立;2023年,Euler轻量化大模型发布。核心技术介绍如下:
(1)轻量化私有大模型技术——Euler。Euler是自然语义基于多年对NLP的理解,从底层完成自研的一款2.5B(25亿)轻量化大模型,原生支持32K(约2.5万字)的连续上下文理解,无需联网即可在个人笔记本上完成推理与微调,最低仅需几千元成本就能拥有属于自己的私域大模型。Euler让大语言模型真正走入场景,为个人及中小企业团队提供普惠生成式赋能。
(2)自然语言处理算法集合——HanLP。HanLP是自然语义主持开发并开源的自然语言处理技术,自2014年开源以来持续10年更新,已成为全球用户量排名第一的项目。具有功能完善、性能高效、架构清晰、语料时新、可自定义等特点,提供词法分析、句法分析、文本分析和情感分析等功能,已被广泛的应用在工业、科研等领域中。
(3)高斯多云数据库管理系统。高斯多元统一数据库管理系统(简称“多元数据库”)是一套用于打通不同信息化系统数据库、实现数据顶层共享与汇聚的管理系统,为政府及大型企事业单位的数据管理者提供自上而下的数据调阅与管控手段。多元数据库通过数据库容器化的手段,有效降低信息化项目建设成本、避免数据库资重复建设,还能避免数据孤岛的形成,在存储环节实现数据的高效利用和互联互通。
(4)GPU资源动态管理系统。系统基于GPU资源动态切割与分配技术开发,是国内对于GPU算力使用上较为先进的技术方案。系统能够根据不同等级算力、场景需求提供动态的算力封装,支持弹性部署与实时备份。能够极大程度提升GPU算力的利用率,解决基础支撑资源建设的开支。
责任编辑:姜凯宁
