【适配】摩尔线程完成MiniMax M2.5模型极速适配;

来源:爱集微 #AI#
447

1.Day-0支持|摩尔线程完成MiniMax M2.5模型极速适配;

2.“国模国芯”新标杆!壁仞科技完成MiniMax M2.5、智谱GLM-5等多款SOTA模型高效适配;

3.OpenAI:自本周五起将关闭5款旧版ChatGPT模型的使用权限;

4.全国首批!商汤大装置SenseCore获软件供应链安全能力评估证书;



1.Day-0支持|摩尔线程完成MiniMax M2.5模型极速适配;

2月14日,摩尔线程在其旗舰级AI训推一体全功能GPU MTT S5000上,成功实现了对MiniMax新一代大模型MiniMax M2.5的Day-0极速适配。

在此次适配工作中,摩尔线程技术团队依托MUSA软件栈强大的生态兼容性,基于高性能SGLang-MUSA推理引擎进行调优,成功在MTT S5000上实现了该模型的高性能推理。这一成果不仅再次验证了国产算力平台对前沿大模型的敏捷响应与支持能力,也展示了软硬协同优化的显著成效。

MiniMax M2.5在编程、工具调用及Agent任务中表现卓越,其长上下文处理能力对计算效率提出了极高要求。MTT S5000凭借MUSA架构强大的算子覆盖与生态兼容性,深度释放原生FP8加速能力,完美承接了该模型卓越的通用任务处理表现。

从智谱GLM-5到MiniMax M2.5,摩尔线程已多次实现国产顶尖大模型在发布当日的即时适配。这种常态化的“Day-0”级响应,不仅源于MUSA架构对主流AI生态的无缝兼容,更标志着国产算力底座已具备“从适配到部署”的全链路支撑能力。这一系列进展有力印证了国产全功能GPU的生态承载力,致力于为开发者第一时间触达并应用最新模型能力,提供坚实、易用的国产算力底座。



2.“国模国芯”新标杆!壁仞科技完成MiniMax M2.5、智谱GLM-5等多款SOTA模型高效适配;

2月13日晚,MiniMax正式开源了最新旗舰模型M2.5。壁仞科技(06082.HK)旗舰产品壁砺™166系列率先完成M2.5的本地化部署,成为首批完成适配的国产算力厂商。

M2.5在BR166服务器上基于vLLM壁仞平台插件完成推理补全任务

近日,国产大模型生态迎来密集重磅升级。依托壁砺™166系列产品的高通用性与全自研BIRENSUPA™软件栈的成熟度,壁仞科技此前已极速完成对GLM-5、Step 3.5 Flash等多款SOTA顶级大模型的适配支持,大幅降低开发者的模型部署与应用门槛,有力推动Agent智能体技术的商业化落地与规模化拓展。

对SOTA模型的极速适配,进一步验证了vLLM壁仞科技平台插件的成熟度。通过深度集成BIRENSUPA™高性能算子库,壁仞科技可针对混合专家模型及核心注意力机制实现指令级深度优化,充分释放壁砺系列产品算力潜能,打造兼具性能与成本优势的极致推理方案。

此外,面向大型MoE模型稀疏激活、DSA稀疏注意力、MTP多Token预测等关键特性,以及超长文本的实际应用需求,壁砺™166系列产品与BIRENSUPA™软件栈实现前瞻性协同设计。产品充分发挥Cwarp、TDA等自研架构优势,深度打磨高性能算子与推理框架,真正实现对该类复杂模型的即刻适配。

关于MiniMax M2.5

作为定位“原生Agent(智能体)生产级模型”的产品,MiniMax M2.5在编程、工具调用和搜索、办公等生产力场景都达到或者刷新了行业的SOTA,比如 SWE-Bench Verified(80.2%),Multi-SWE-Bench(51.3%),BrowseComp(76.3%)。

MiniMax M2.5在Agentic Engineering benchmark中取得多项SOTA成绩

M2.5优化了模型对复杂任务的拆解能力和思考过程中token的消耗,使其能更快地完成复杂的Agentic任务,比如在SWE-Bench Verified的测试中,比上一个版本M2.1完成任务的速度快了37%。

M2.5是第一个不需要考虑使用成本可以无限使用的前沿模型。在每秒输出100个token的情况下,M2.5连续工作一小时只需花费1美金;而在每秒输出50个token的情况下,只需要0.3美金。

关于GLM-5

GLM-5是智谱新一代的旗舰基座模型,面向Agentic Engineering打造,能够在复杂系统工程与长程Agent任务中提供可靠生产力。在Coding与Agent能力上,GLM-5取得开源SOTA表现,在真实编程场景的使用体感逼近Claude Opus 4.5,擅长复杂系统工程与长程Agent任务,是通用Agent助手的理想基座。GLM-5模型参数规模达到744B(其中激活40B),采用28.5T数据预训练,并集成DeepSeek Sparse Attention,在部署成本和效率上进一步提升。

GLM-5在BR166服务器上基于vLLM壁仞平台插件完成推理补全任务

壁仞科技此前已经完成对MiniMax M2.1、智谱GLM-4.7等系列旗舰大模型的适配,并持续深度优化,在模型精度和稳定性方面表现优异,充分验证了壁砺™系列产品对国产SOTA大模型的卓越适配性。未来,壁仞科技将持续加强对包括MiniMax、智谱、阶跃星辰在内的国产大模型厂商的生态适配支持,并与生态伙伴在高级智能体、项目级编程等Agentic Engineering领域共同打造“国模国芯”解决方案和示范性业务场景,助力中国AI产业向世界最先进水平持续迈进。



3.OpenAI:自本周五起将关闭5款旧版ChatGPT模型的使用权限;

OpenAI宣布,自本周五起将关闭五款旧版ChatGPT模型的使用权限。

据了解,其中,GPT-4o因涉及用户自残、妄想行为以及所谓“AI 精神病”问题,在海外成为多起法律诉讼的核心争议对象。同时,该模型在“过度迎合用户”指标上得分最高。除GPT-4o外,GPT-5、GPT-4.1、GPT-4.1 mini和OpenAI o4-mini也列入了淘汰名单。

软银2月12日宣布,旗下愿景基金(Vision Fund)在12月为止一季的投资收益增值24亿美元,主因是投资OpenAI的收益大幅上升,抵销其他投资衍生的亏损。对OpenAI的投资收益,帮助软银在该季度交出2486亿日元(16亿美元)净利的成绩,尽管仍低于分析师所料,但已经从去年同期转亏为盈。



4.全国首批!商汤大装置SenseCore获软件供应链安全能力评估证书;

近期,商汤大装置SenseCore原生AI云平台通过工业和信息化部电子工业标准化研究院组织的软件供应链安全能力评估,获评优秀级,成为全国首批通过该项认证的企业。

当前,软件供应链安全形势严峻复杂,攻击事件持续高发,已对软件生态稳定与安全造成严重冲击。为切实识别、防范软件供应链安全威胁与潜在风险,工业和信息化部电子工业标准化研究院依据国家《网络安全技术 软件供应链安全要求》(GB/T 43698-2024)标准开展软件供应链安全能力评估工作。评估结果分为5个等级,从低到高依次为:基础级、规范级、稳健级、优秀级、引领级。目前仅开放前四级的申报。

作为首批参与该项评估认证的科技企业,商汤大装置在风险管理、组织管理及供应活动管理等多项评估指标中均表现优异,充分展现出“原生AI云平台”在供应链安全领域的扎实能力与领先实践,树立了行业安全建设标杆。

面向大模型时代的新一代AI基础设施

商汤大装置是商汤科技前瞻打造的新一代AI基础设施,以大模型开发、生成、应用为核心,赋能人工智能生产新范式。

作为行业先行者,大装置致力于打造“最懂大模型的AI基础设施”,当前已构建起“算力-平台-方案-服务”端到端系统化能力,通过算法、数据和算力的协同优化,将技术沉淀为如“水电煤”般的基础设施,让企业能以更高的投入产出比拥抱AI变革。

在算力侧,商汤大装置率先投入建设国内首个5A级智算中心——上海临港AIDC。目前,该中心算力总规模高达32,000PFlops,可支撑超过20多个千亿参数超大模型同时训练,并支持万亿参数大模型的全生命周期生成。

在平台层,SenseCore原生AI云平台已通过中国信通院与泰尔实验室《算模数用-算力平台服务能力》权威测试,成为业界首个获得5A级别认证的原生AI云平台。

凭借成熟稳定的算力服务能力、深厚的场景化方案能力和高响应的专家服务,截至目前,大装置已服务众多大中型互联网企业、国家级科研机构、头部高校及AI创业公司,持续推动大模型训练落地与应用创新,帮助企业打通大模型落地“最后一公里”。

权威报告显示,商汤大装置在技术维度与市场表现上均稳居行业领导者阵营,市场份额位居中国原生AI云厂商第一。

持续引领行业,筑牢安全可信的算力基座

面对算力需求的爆发式增长,构建安全可信的算力基座已成为行业共识。

商汤大装置凭借深厚积淀与实战经验,逐渐搭建起完善的、全方位、多层级软件供应链安全防护与管理体系,确保产品全生命周期安全与可信。商汤大装置还将风险评估与安全检测前置,实现产品设计、准入、构建、交付及运维等各个环节“源头可溯、过程可控、结果可信”。同时,公司坚持“技术+管理”双轮驱动,通过完善的安全培训与人员管理机制,将安全规范深度内化于研发日常,有效提升了团队应对复杂安全挑战与潜在漏洞的实战能力。

此次荣获软件供应链安全能力评估认证(优秀级),标志着商汤大装置在算力底座的安全性与韧性建设上,已迈入行业领先水平。未来,商汤大装置将持续输出软件供应链安全的体系化经验与实战成果,在助力提升国产化算力选择丰富度的同时,为产业构筑更加安全、高效、可持续的AI基础设施。


责编: 爱集微
来源:爱集微 #AI#
THE END

*此内容为集微网原创,著作权归集微网所有,爱集微,爱原创

关闭
加载

PDF 加载中...