MODEL_ROUTING_ARCHITECTURE_DIFF.md - 路由计划 vs 现实对照
AI 导读
MODEL_ROUTING_ARCHITECTURE_DIFF.md - 路由计划 vs 现实对照 版本: v1.1 | 状态: 对照清单 | 更新时间: 2026-01-10 说明: 对照旧版 MODEL_ROUTING_ARCHITECTURE.md 与当前真实代码链路,突出关键差异与影响。 1. 结论摘要 现行系统仍是 双栈路由(Backend 与 Web 分离),但基础规则已抽至共享内核...
MODEL_ROUTING_ARCHITECTURE_DIFF.md - 路由计划 vs 现实对照
版本: v1.1 | 状态: 对照清单 | 更新时间: 2026-01-10 说明: 对照旧版
MODEL_ROUTING_ARCHITECTURE.md与当前真实代码链路,突出关键差异与影响。
1. 结论摘要
- 现行系统仍是 双栈路由(Backend 与 Web 分离),但基础规则已抽至共享内核
model-router-core。 - Zenmux 在 Backend 路由链中 未出现;Web 路由链中仅部分 family 使用。
- Web 引入 任务路由(Task Router) 与 服务级 fallback,旧文档未覆盖。
- PPT 图片链路已 收敛:Google 仅
gemini-3-pro-image-preview,Poe 仅nano-banana-pro。 - 旧文档的“统一质量档位/场景配置”与现行代码实现 不一致(Web 有场景配置,Backend 用 env 默认)。
2. 差异对照表(关键路径)
| 维度 | 旧文档(计划) | 现行代码(现实) | 影响 |
|---|---|---|---|
| 路由架构 | 单一 SmartRouter 统一入口 | Backend (src/llm/*) + Web (apps/web/lib/llm/*) 双栈 |
同名模型在不同路径下 fallback 不一致 |
| 路由内核 | 未拆分 | src/llm/shared/model-router-core.ts 统一 family/transform/env |
基础规则统一但链路仍分离 |
| Zenmux | 多数 family 进入 fallback | Backend 不在 fallback;Web 仅 gpt/other 部分出现 | “配置里有 Zenmux”≠“实际会走” |
| SiliconFlow | 作为聚合/加速分支 | Web deepseek/glm/kimi/qwen/llama/mistral/other 引入;Backend 未引入 | 国内加速仅 Web 路由侧生效 |
| Gemini fallback | Google → Poe → OpenRouter | Backend/Web 一致 | 与旧文档一致 |
| GPT fallback | Poe → OpenRouter → Zenmux → OpenAI | Backend: Poe → OpenRouter → OpenAI;Web: Poe → OpenRouter → Zenmux → OpenAI | Backend 缺少 Zenmux |
| DeepSeek fallback | Poe → Zenmux → OpenRouter → DeepSeek | Backend: Poe → OpenRouter → DeepSeek;Web: Poe → SiliconFlow → OpenRouter → DeepSeek | 现实路径差异明显 |
| 任务路由 | 未提及 Task Router | Web 有 task-model-router + SmartChat 动态路由 |
实际调用更依赖 TaskType 选择 |
| 文本服务 fallback | 统一按 SmartRouter | Web 多个 API 显式 try/catch fallback | 服务级 fallback 与路由层并存 |
| PPT 图片链路 | Google: Pro → Flash;Poe: 多模型链 | Google: 仅 Pro;Poe: 仅 nano-banana-pro | PPT 文生图链路更短、更确定 |
| 质量档位 | Premium/Balanced/Fast 三档 | Backend 用 env 默认;Web 有场景配置但不等同路由 | 质量档位未统一执行 |
| Google Key | Ai-studio-jason 单账号 | Web GOOGLE_API_KEYS 单条 entry,轮询逻辑保留 |
与旧文档一致(数量为 1) |
3. 现行链路摘要(用于快速核对)
Backend:
src/llm/model-router.ts- gpt: poe → openrouter → openai
- claude: poe → openrouter → anthropic
- gemini: google → poe → openrouter
- deepseek: poe → openrouter → deepseek
- glm: poe → openrouter
- kimi: poe → openrouter
- qwen: poe → openrouter
- llama: poe → openrouter
- mistral: poe → openrouter
- other: poe → openrouter
- 注: 实际可用链路会过滤未配置 Key 与非支持 provider
Web:
apps/web/lib/llm/model-router.ts- gpt: poe → openrouter → zenmux → openai
- claude: poe → openrouter → anthropic
- gemini: google → poe → openrouter
- deepseek: poe → siliconflow → openrouter → deepseek
- glm: siliconflow → poe → openrouter → zhipu
- kimi: siliconflow → poe → openrouter → kimi
- qwen: siliconflow → poe → openrouter → alibaba
- llama/mistral: poe → openrouter → siliconflow
- other: poe → openrouter → siliconflow → zenmux
PPT 图片:
apps/web/lib/services/image-generation.ts- PPT 场景:Google
gemini-3-pro-image-previewonly → Poenano-banana-proonly
- PPT 场景:Google
更多细节见 docs/MODEL_ROUTING_ARCHITECTURE_CURRENT.md。
4. 证据索引(代码来源)
src/llm/model-router.tssrc/llm/shared/model-router-core.tssrc/llm/smart-router.tssrc/config/models.tsapps/web/lib/llm/model-router.tsapps/web/lib/llm/smart-router.tsapps/web/lib/llm/task-model-router.tsapps/web/app/api/ai/smart-chat/route.tsapps/web/lib/services/image-generation.tsapps/web/app/api/services/generate-ppt/route.tsapps/web/app/api/services/slide-ai-assist/route.tsapps/web/app/api/services/ai-text-enhance/route.tsapps/web/app/api/services/ai-polish/route.tsapps/web/app/api/services/sheet-process/route.ts
猪哥云(四川)网络科技有限公司 | 合规网 www.hegui.com 猪哥云-数据产品部-Maurice | [email protected] 2025 猪哥云-灵阙企业级智能体平台
深度加工(NotebookLM 生成)
基于本文内容生成的 PPT 大纲、博客摘要、短视频脚本与 Deep Dive 播客,用于多场景复用
PPT 大纲(5-8 张幻灯片) 点击展开
MODEL_ROUTING_ARCHITECTURE_DIFF.md - 路由计划 vs 现实对照 — ppt
幻灯片 1:路由计划与现实对照:结论摘要
- 现行系统未实现单一入口,而是维持 Backend 与 Web 分离的“双栈路由”架构 [1]。
- 基础路由规则已被抽取并统一至共享内核
model-router-core中 [1]。 - 计划中作为兜底的 Zenmux 在后端路由链中未出现,在 Web 端也仅有部分模型族使用 [1]。
- Web 端引入了旧文档未覆盖的“任务路由(Task Router)”与“服务级 fallback” [1]。
幻灯片 2:核心路由架构对比
- 计划架构:原计划采用单一的 SmartRouter 作为全局统一入口 [1]。
- 现实架构:实际代码分为 Backend(
src/llm/*)和 Web(apps/web/lib/llm/*)两套平行的体系 [1]。 - 架构影响:这种双栈架构导致同名模型在不同调用路径下的 fallback 机制不一致 [1]。
- 内核状态:尽管链路分离,但基础的 family、transform 和 env 规则已经通过
model-router-core.ts实现了统一 [1]。
幻灯片 3:服务提供商(Provider)调用差异
- Zenmux 使用现状:旧文档计划其承担多数模型的 fallback,但现实是“配置中有≠实际会走”,Backend 完全未接入 Zenmux [1]。
- SiliconFlow 的引入:作为聚合和加速分支被引入系统,支持 DeepSeek、GLM、Kimi 等国内模型 [1]。
- 加速生效范围:国内加速目前存在非对称性,SiliconFlow 仅在 Web 路由侧生效,Backend 未引入 [1]。
幻灯片 4:关键大模型的 Fallback 链路实况
- Gemini 链路:Backend 与 Web 保持一致,均严格按照 Google → Poe → OpenRouter 顺序回退 [1]。
- GPT 链路:Web 链路按预期包含 Zenmux(Poe → OpenRouter → Zenmux → OpenAI),但 Backend 直接跳过了 Zenmux [1, 2]。
- DeepSeek 链路:由于 Web 端特有加速,其回退链路包含了 SiliconFlow,而后端则直接通过 Poe 和 OpenRouter 调用 DeepSeek [2, 3]。
幻灯片 5:Web 端特有的高级路由机制
- 任务路由的引入:Web 端独有
task-model-router和SmartChat,实际调用动态依赖于 TaskType 的选择 [2, 3]。 - 服务级回退(Fallback):Web 端不再完全依赖底层的统一路由回退,而是存在多个 API 显式通过 try/catch 实现的服务级 fallback [2]。
- 质量档位执行:原定的 Premium/Balanced/Fast 三档质量未被统一执行,Web 采用场景配置,而 Backend 仅依赖环境变量默认值 [2]。
幻灯片 6:PPT 图像生成链路的高度收敛
- 链路精简:相比起复杂的多模型 fallback 链,PPT 文生图链路变得更短、更具确定性 [2]。
- Google 专用模型:在 PPT 图像场景下,Google 节点仅使用特定的
gemini-3-pro-image-preview模型 [1, 3]。 - Poe 专用模型:在同场景下,Poe 节点收敛为仅调用
nano-banana-pro[1, 3]。
幻灯片 7:代码证据索引与核对清单
- 后端逻辑溯源:核心链路可在
src/llm/model-router.ts和model-router-core.ts中查证 [3]。 - Web 端逻辑溯源:任务路由及服务级代码分布在
apps/web/lib/llm/及具体的 AI API 路由中 [3, 4]。 - PPT 场景溯源:图像生成的专有链路逻辑可在
apps/web/lib/services/image-generation.ts和生成 PPT 相关 API 中获取具体证据 [3]。
博客摘要 + 核心看点 点击展开
MODEL_ROUTING_ARCHITECTURE_DIFF.md - 路由计划 vs 现实对照 — summary
SEO 友好博客摘要
本文深入对比了大模型路由架构的计划与现实实现 [1]。通过梳理代码发现,系统依然维持 Backend 与 Web 的双栈路由模式,并成功抽离了基础共享内核 [1]。文章详细剖析了 Zenmux、SiliconFlow 等平台在双端的 fallback 链路差异 [1, 2],并揭示了 Web 端引入的任务路由机制及 PPT 文生图链路的精简收敛策略 [1, 3]。这为开发者优化 API 调用、排查模型容灾逻辑提供了真实的代码级对照指南。
核心看点
- 双栈路由与共享内核并存:维持 Backend 与 Web 分离的双栈路由,基础规则抽离至共享内核 [1]。
- 两端 Fallback 链路差异显著:Backend 链中未出现 Zenmux,而 Web 端引入 SiliconFlow 加速分支 [1, 2]。
- 新增任务路由与链路收敛:Web 端引入任务路由,且 PPT 绘图链路收敛至单一确定模型 [1, 3]。
60 秒短视频脚本 点击展开
MODEL_ROUTING_ARCHITECTURE_DIFF.md - 路由计划 vs 现实对照 — video
这是一段为您定制的60秒短视频脚本,严格按照字数和结构要求编写:
【钩子开场】(12字)
路由计划与实际代码一样吗?[1]
【核心解说】
- 架构现状(29字):系统暂未统一,仍是后端与Web双栈路由,但基础规则已共享。[1]
- 链路差异(30字):模型链路差异大,后端缺Zenmux,国内加速仅Web侧生效。[1, 2]
- 功能收敛(28字):PPT图片链路收敛,仅保留谷歌与Poe特定模型,路径更短。[1-3]
【一句收束】
规划很理想,现实需打磨,系统架构的彻底统一仍在路上!
课后巩固
与本文内容匹配的闪卡与测验,帮助巩固所学知识
延伸阅读
根据本文主题,为你推荐相关的学习资料