壁仞科技公益支持项目入选联合国教科文组织2025年度示范案例

来源:壁仞科技Birentech #壁仞科技# #国产算力# #澜湄项目#
944

国产算力守护濒危语言

2026年3月27日,第五届“创意2030国际论坛”在北京举行。论坛上,联合国教科文组织发布2025年度“数字环境下保护与促进文化表现形式多样性示范案例”,由云南濒危语言文化传播有限公司、智译、壁仞科技(06082.HK)联合申报的“澜湄国家跨境语言AI大模型”项目成功入选。

“澜湄国家跨境语言AI大模型”项目入选

该项目不仅为破解澜湄流域国家长期存在的交流障碍、经济发展滞后、跨境治理等深层问题提供关键突破口,还有效填补了国内乃至全球在极低资源语言模型领域的技术空白。对此,壁仞科技表示:“科技发展始终以服务人类福祉为最终归宿。公司倍感荣幸能够为守护文化多样性、推动区域繁荣稳定贡献中国算力力量,未来将持续以自主算力践行‘科技向善’理念,推动科技成果普惠共享,增进民生福祉。”

从乡土公益到跨境项目

“澜湄国家跨境语言AI大模型项目”的起点,源于壁仞科技在云南的长期公益行动。

壁仞科技公益团队与云南濒危语言文化传播有限公司白碧波教授、许鲜明教授及智译团队负责人刘畅源博士在云南乡村公益活动中发现,边疆地区留守儿童存在普通话沟通能力薄弱、少数民族语言传承困难等问题,而相应的数字化工具严重匮乏。

哈尼语翻译界面

为帮助当地儿童跨越语言沟通壁垒,哈尼语AI系统应运而生。与此同时,鉴于众多少数民族儿童面临同类发展困境,项目逐步从云南哈尼族村落拓展覆盖至整个澜湄流域国家,最终落地形成澜湄国家跨境语言AI大模型整体成果。

攻克极低资源语言难题

当前,在自然语言处理领域,研究长期聚焦于英语、汉语等高资源语言。而澜湄流域涵盖六国,语言种类繁多且互通性低;其中,泰语、缅甸语、老挝语以及国内少数民族语言,多属于低资源甚至极低资源语言。由于传统的模型训练方法无法适配这类语言的语料特点,低资源语言在大模型训练上是世界性难题,相关技术研发长期处于空白状态。

项目上线六个语言翻译界面

为攻克这一难题,项目团队组建了一支语言学家与AI专家深度融合的跨学科队伍,并耗时一年,完成澜湄流域国家29种语言的语料采集。在此基础上,项目团队先后研发出哈尼语、苗语六大方言的AI文本翻译与创作系统,AI语音合成系统,并最终迭代形成澜湄国家跨境语言AI大模型。

在推进的过程中,项目团队克服发音人稀缺、标注专家难寻、采集成本高昂等诸多困难。以哈尼语为例,该语言虽有国家标准规范拼音方案,但因方言土语诸多,需耗时适配后方可进行AI训练,仅一分钟语料的标注成本就高达千元以上,这也是鲜有团队大力投入该领域的核心原因之一。

让科技照亮更多角落

“澜湄国家跨境语言AI大模型”项目汇聚多方力量。北京大学、浙江大学、云南师范大学等高校提供关键学术支撑;壁仞科技作为国产通用GPU领军企业,为模型研发与落地筑牢坚实算力根基。

壁仞科技与项目团队的携手源于双方在“技术平权”理念上的高度契合。未来,依托壁仞科技自主可控的国产算力底座,项目团队计划搭建世界语言中心,开发覆盖全球更多种语言的世界语言AI大模型。

从关注哈尼族留守儿童的语言困境,到攻克极低资源语言模型难题,再到立志打造覆盖全球的语言AI大模型,技术进步的成果不仅惠及“大众”,也可帮扶“小众”。这既是项目的价值所在,也是壁仞科技坚持“科技向善”技术理念的生动实践。

责编: 爱集微
来源:壁仞科技Birentech #壁仞科技# #国产算力# #澜湄项目#
THE END
关闭
加载

PDF 加载中...