您的位置:首页 >壁仞科技完成智谱新一代旗舰模型适配
发布于2026-04-24 阅读(0)
扫一扫,手机访问
4月8日,大模型领域传来重磅更新:智谱正式上线并开源了新一代旗舰模型GLM-5.1。这一迭代版本的最大看点,在于其针对“长程任务”的处理能力取得了显著突破,无疑将拓展模型在实际应用中的边界。
硬件适配的速度,往往最能反映一个生态的活力。就在模型发布的同一天,壁仞科技便宣布,其壁砺166系列产品已完成对GLM-5.1的适配,成为国内首批支持该模型的国产GPU厂商之一。这个速度,本身就颇具信号意义。
面对GLM-5.1引入的744B混合专家(MoE)架构、200K超长上下文以及DSA稀疏注意力等核心新特性,简单的兼容显然不够。根据官方透露的信息,壁仞科技的适配策略是全栈深度优化。其核心打法是,依托自研芯片的高算力底座,与BIRENSUPA软件栈进行算子级的深度协同。
具体而言,团队基于vLLM、SGLang这两大主流开源推理框架,对模型的几个关键瓶颈进行了精准优化。一方面,是针对40B激活参数与Interlea ve Thinking(交叉推理)模式进行了适配,从而确保在200K的超长上下文窗口下,依然能实现“无损推理”,保持模型的理解连贯性与准确性。
另一方面,为了将这种能力高效地转化为实际服务,一系列性能优化技术被组合运用。这其中,就包括了针对MoE模型的专家调度优化、对稀疏计算的专项支持,以及综合运用Tensor Parallel(张量并行)、Context Parallel(上下文并行)、MTP(模型张量并行)等多种并行策略。最终目标很明确:在提供超长上下文能力的同时,实现低时延与高吞吐,让大模型的“长记性”不以牺牲响应速度为代价。
售后无忧
立即购买>office旗舰店
售后无忧
立即购买>office旗舰店
售后无忧
立即购买>office旗舰店
售后无忧
立即购买>office旗舰店
正版软件
正版软件
正版软件
正版软件
正版软件
1
2
3
4
5
6
7
8
9