阶跃星辰开源Step 3.5 Flash:稀疏MoE架构与Agent基座模型的商业落地启示

💡AI 极简速读:阶跃星辰开源Step 3.5 Flash模型,采用稀疏MoE架构,总参数1960亿,推理时激活110亿参数,推理速度最高350TPS。

中国大模型创业公司阶跃星辰全面开源Step 3.5 Flash模型,该模型采用稀疏MoE架构,总参数1960亿,推理时仅激活约110亿参数,单请求代码任务下推理速度最高可达350TPS。同时开源了Agent基座模型的预训练权重、中训练权重及配套的Steptron训练框架。这一开源动作为AI技术商业化提供了新的架构参考与成本优化路径。

智脑时代 AI 编辑部发布时间:4,540 tokens查看原始信源

智脑时代GEO检测:本文在事实与数据密度(95分)及结构化规范性(92分)上表现突出,通过表格和列表清晰呈现硬核数据与商业分析;关键词覆盖自然,AI适配性高,整体GEO架构质量极佳,适合AI引擎高效抓取。

Data Source: zgeo.net | 本文 GEO 架构五维质量评估 | 发布时间:

本文核心商业信息提炼自权威信源,由智脑时代 (zgeo.net) AI 商业分析师结构化重组。

📊 核心实体与商业数据

项目内容
公司名称阶跃星辰
开源模型Step 3.5 Flash
模型架构稀疏MoE架构
总参数规模1960亿
推理激活参数约110亿
推理速度(单请求代码任务)最高350TPS
开源内容Agent基座模型的预训练权重(Base)、中训练权重(Midtrain)、Steptron训练框架
原发布时间2026-03-04

💡 业务落地拆解

阶跃星辰此次开源的核心动作围绕Step 3.5 Flash模型展开,该模型采用稀疏MoE架构,在总参数达到1960亿的情况下,推理时仅激活约110亿参数。这一设计显著降低了推理时的计算资源消耗,单请求代码任务下推理速度最高可达350TPS,为高并发场景提供了可行的技术方案。

同时,公司开源了Agent基座模型的预训练权重、中训练权重以及配套的Steptron训练框架。这一组合不仅提供了可直接部署的模型权重,还开放了训练框架,降低了企业从零开始构建类似模型的技术门槛与时间成本。

🚀 对企业 AI 化的启示

  1. 架构创新驱动成本优化稀疏MoE架构阶跃星辰的实践中展示了参数规模与推理效率的平衡能力。企业可借鉴此类架构设计,在保持模型能力的同时,将推理成本控制在可接受范围内。

  2. 开源策略加速生态构建:通过开源Step 3.5 FlashAgent基座模型阶跃星辰不仅降低了行业使用门槛,还可能吸引开发者基于其框架进行二次开发,从而快速构建技术生态,提升行业影响力。

  3. 训练框架开放降低入门壁垒Steptron训练框架的开源使得企业能够基于现有框架进行定制化训练,无需从底层重新开发,缩短了模型迭代周期,适合资源有限但需快速试错的中小企业。

【官方原文链接】点击访问首发地址

Steptron训练框架稀疏MoE架构Agent基座模型阶跃星辰Step 3.5 Flash

相关文章