阶跃星辰Step 3.5 Flash

工具简介

阶跃星辰(StepFun)2026年2月发布的开源旗舰基座模型Step 3.5 Flash,激活参数仅11B,推理速度最高350 tokens/s,开源5天即登顶OpenClaw全球调用量榜首,是目前国产免费Agent模型中最能打的"小钢炮"。

核心功能亮点

  • 极致速度:稀疏MoE架构,仅激活11B参数就能输出350 tokens/s,比同级别Kimi K2.5、Qwen3-Max-Thinking快3-5倍
  • Agent原生:SWE-bench Verified得分74.4%,Terminal-Bench超55%,开箱即用做代码/工具调用任务
  • 完全免费:在OpenRouter上提供免费API层,普通用户零成本就能跑通5个实战Agent应用

详细使用步骤与实测体验

第一步:白嫖OpenRouter的免费API
打开 openrouter.ai 用谷歌账号登录,进入Keys页面创建一个新Key(名字随便起),复制保存即可。整个过程不到2分钟,注册即送免费额度,Step 3.5 Flash模型目前处于限免阶段,普通用户每天有充足token够用。

第二步:3分钟接入OpenClaw
打开OpenClaw客户端,配置Base URL为 https://openrouter.ai/api/v1,把刚才的API Key粘进去,模型名选择 stepfun/step-3.5-flash:free,保存后立即可用。我实测从注册到对话出第一句回复,只花了3分钟,零门槛。

第三步:跑通第一个Agent任务
我给它的Prompt是:"帮我写一个Python脚本,爬取知乎热榜前10条标题和链接,保存到CSV"。它不仅给出了完整代码,还主动建议用 requests-html 而不是 requests+bs4,理由是知乎需要JS渲染。这种"主动选型"的能力,在11B激活参数的模型里非常罕见。

第四步:测一下多步推理
给它一道经典的"鸡兔同笼+变种"题(35头94足,问鸡兔各几只),它不仅列出了标准解法,还给出了"假设全是鸡"的思路过程,回答速度比豆包快2倍以上,肉眼可见的"打字机"效果。在Terminal-Bench的测试中,Step 3.5 Flash对Linux命令的意图理解也明显强于同尺寸模型。

第五步:薅羊毛注意事项
免费层有每分钟请求数限制(实测约20次/分钟),批量任务需要加sleep;高峰期可能出现限流,建议错峰使用。如果你是重度Agent开发者,可以去阶跃星辰开放平台申请生产级API,价格也远低于GPT-4级别。

适用人群与场景

  • Agent开发者:需要快速验证想法,又不想烧token的独立开发者
  • 学习者:想体验国产开源SOTA模型能力的学生/研究者
  • 效率极客:把AI接入OpenClaw、Codex等工具做自动化任务
  • 自媒体/办公族:日常写文案、整理资料、生成脚本

优缺点总结

✅ 优点:速度炸裂(350 TPS)、完全免费、Agent能力对标Kimi K2.5/通义千问、OpenRouter一键接入、生态完善。
❌ 缺点:多模态能力弱(纯文本模型)、长上下文不如Kimi 256K那么变态、免费层有速率限制、生产环境需要付费API。

对比同类:相比Kimi K2.6(闭源、贵)和DeepSeek V3(虽然便宜但速度慢),Step 3.5 Flash在"免费+快+Agent强"这个三角上做到了甜点位。

早悟点评

阶跃星辰这一步棋下得很聪明——用"小激活参数+大总参数"的稀疏MoE架构,把推理成本压到了极致,再用开源策略抢开发者心智。Step 3.5 Flash不是参数最大的,也不是跑分最高的,但它可能是"普通人最容易薅到、用得最爽"的那个。2026年的国产大模型竞赛,已经从"谁更聪明"转向"谁更好用、更便宜、更开放",Step 3.5 Flash正好踩中了这个转折点。建议每个做Agent的人都去试一下,0元体验SOTA不香吗?

行业观察

从2026年初的模型发布节奏可以看出,国产大模型已经进入"应用驱动"阶段:阶跃星辰Step 3.5 Flash、小米MiMo-V2.5-Pro、Kimi K2.6、Qwen3.7相继开源或大幅降价,核心目的都是抢占Agent生态的入口。可以预见的是,2026年下半年,"免费+开源+高速"将成为Agent基座模型的标准配置,付费闭源模型将不得不向价值链上游(垂直行业、企业级SLA)转移。对普通用户来说,这是最好的时代——曾经每月100美金的AI订阅,现在用免费模型就能覆盖90%的日常工作流。

发表评论