MODEL_ROUTING_ARCHITECTURE_DIFF.md - 路由计划 vs 现实对照

原创灵阙教研团队

S 精选进阶对比评测 | 约 3 分钟阅读更新于 2026-01-10

AI 导读

MODEL_ROUTING_ARCHITECTURE_DIFF.md - 路由计划 vs 现实对照版本: v1.1 | 状态: 对照清单 | 更新时间: 2026-01-10 说明: 对照旧版 MODEL_ROUTING_ARCHITECTURE.md 与当前真实代码链路，突出关键差异与影响。 1. 结论摘要现行系统仍是双栈路由（Backend 与 Web 分离），但基础规则已抽至共享内核...

MODEL_ROUTING_ARCHITECTURE_DIFF.md - 路由计划 vs 现实对照

版本: v1.1 | 状态: 对照清单 | 更新时间: 2026-01-10 说明: 对照旧版 MODEL_ROUTING_ARCHITECTURE.md 与当前真实代码链路，突出关键差异与影响。

1. 结论摘要

现行系统仍是 双栈路由（Backend 与 Web 分离），但基础规则已抽至共享内核 model-router-core。
Zenmux 在 Backend 路由链中 未出现；Web 路由链中仅部分 family 使用。
Web 引入 任务路由（Task Router） 与 服务级 fallback，旧文档未覆盖。
PPT 图片链路已收敛：Google 仅 gemini-3-pro-image-preview，Poe 仅 nano-banana-pro。
旧文档的“统一质量档位/场景配置”与现行代码实现 不一致（Web 有场景配置，Backend 用 env 默认）。

2. 差异对照表（关键路径）

维度	旧文档（计划）	现行代码（现实）	影响
路由架构	单一 SmartRouter 统一入口	Backend (`src/llm/`) + Web (`apps/web/lib/llm/`) 双栈	同名模型在不同路径下 fallback 不一致
路由内核	未拆分	`src/llm/shared/model-router-core.ts` 统一 family/transform/env	基础规则统一但链路仍分离
Zenmux	多数 family 进入 fallback	Backend 不在 fallback；Web 仅 gpt/other 部分出现	“配置里有 Zenmux”≠“实际会走”
SiliconFlow	作为聚合/加速分支	Web deepseek/glm/kimi/qwen/llama/mistral/other 引入；Backend 未引入	国内加速仅 Web 路由侧生效
Gemini fallback	Google → Poe → OpenRouter	Backend/Web 一致	与旧文档一致
GPT fallback	Poe → OpenRouter → Zenmux → OpenAI	Backend: Poe → OpenRouter → OpenAI；Web: Poe → OpenRouter → Zenmux → OpenAI	Backend 缺少 Zenmux
DeepSeek fallback	Poe → Zenmux → OpenRouter → DeepSeek	Backend: Poe → OpenRouter → DeepSeek；Web: Poe → SiliconFlow → OpenRouter → DeepSeek	现实路径差异明显
任务路由	未提及 Task Router	Web 有 `task-model-router` + SmartChat 动态路由	实际调用更依赖 TaskType 选择
文本服务 fallback	统一按 SmartRouter	Web 多个 API 显式 try/catch fallback	服务级 fallback 与路由层并存
PPT 图片链路	Google: Pro → Flash；Poe: 多模型链	Google: 仅 Pro；Poe: 仅 nano-banana-pro	PPT 文生图链路更短、更确定
质量档位	Premium/Balanced/Fast 三档	Backend 用 env 默认；Web 有场景配置但不等同路由	质量档位未统一执行
Google Key	Ai-studio-jason 单账号	Web `GOOGLE_API_KEYS` 单条 entry，轮询逻辑保留	与旧文档一致（数量为 1）

3. 现行链路摘要（用于快速核对）

Backend：src/llm/model-router.ts
- gpt: poe → openrouter → openai
- claude: poe → openrouter → anthropic
- gemini: google → poe → openrouter
- deepseek: poe → openrouter → deepseek
- glm: poe → openrouter
- kimi: poe → openrouter
- qwen: poe → openrouter
- llama: poe → openrouter
- mistral: poe → openrouter
- other: poe → openrouter
- 注: 实际可用链路会过滤未配置 Key 与非支持 provider
Web：apps/web/lib/llm/model-router.ts
- gpt: poe → openrouter → zenmux → openai
- claude: poe → openrouter → anthropic
- gemini: google → poe → openrouter
- deepseek: poe → siliconflow → openrouter → deepseek
- glm: siliconflow → poe → openrouter → zhipu
- kimi: siliconflow → poe → openrouter → kimi
- qwen: siliconflow → poe → openrouter → alibaba
- llama/mistral: poe → openrouter → siliconflow
- other: poe → openrouter → siliconflow → zenmux
PPT 图片：apps/web/lib/services/image-generation.ts
- PPT 场景：Google gemini-3-pro-image-preview only → Poe nano-banana-pro only

更多细节见 docs/MODEL_ROUTING_ARCHITECTURE_CURRENT.md。

4. 证据索引（代码来源）

src/llm/model-router.ts
src/llm/shared/model-router-core.ts
src/llm/smart-router.ts
src/config/models.ts
apps/web/lib/llm/model-router.ts
apps/web/lib/llm/smart-router.ts
apps/web/lib/llm/task-model-router.ts
apps/web/app/api/ai/smart-chat/route.ts
apps/web/lib/services/image-generation.ts
apps/web/app/api/services/generate-ppt/route.ts
apps/web/app/api/services/slide-ai-assist/route.ts
apps/web/app/api/services/ai-text-enhance/route.ts
apps/web/app/api/services/ai-polish/route.ts
apps/web/app/api/services/sheet-process/route.ts

猪哥云（四川）网络科技有限公司 | 合规网 www.hegui.com 猪哥云-数据产品部-Maurice | [email protected] 2025 猪哥云-灵阙企业级智能体平台

深度加工（NotebookLM 生成）

基于本文内容生成的 PPT 大纲、博客摘要、短视频脚本与 Deep Dive 播客，用于多场景复用

PPT 大纲（5-8 张幻灯片）点击展开

MODEL_ROUTING_ARCHITECTURE_DIFF.md - 路由计划 vs 现实对照 — ppt

幻灯片 1：路由计划与现实对照：结论摘要

现行系统未实现单一入口，而是维持 Backend 与 Web 分离的“双栈路由”架构 [1]。
基础路由规则已被抽取并统一至共享内核 model-router-core 中 [1]。
计划中作为兜底的 Zenmux 在后端路由链中未出现，在 Web 端也仅有部分模型族使用 [1]。
Web 端引入了旧文档未覆盖的“任务路由（Task Router）”与“服务级 fallback” [1]。

幻灯片 2：核心路由架构对比

计划架构：原计划采用单一的 SmartRouter 作为全局统一入口 [1]。
现实架构：实际代码分为 Backend（src/llm/*）和 Web（apps/web/lib/llm/*）两套平行的体系 [1]。
架构影响：这种双栈架构导致同名模型在不同调用路径下的 fallback 机制不一致 [1]。
内核状态：尽管链路分离，但基础的 family、transform 和 env 规则已经通过 model-router-core.ts 实现了统一 [1]。

幻灯片 3：服务提供商（Provider）调用差异

Zenmux 使用现状：旧文档计划其承担多数模型的 fallback，但现实是“配置中有≠实际会走”，Backend 完全未接入 Zenmux [1]。
SiliconFlow 的引入：作为聚合和加速分支被引入系统，支持 DeepSeek、GLM、Kimi 等国内模型 [1]。
加速生效范围：国内加速目前存在非对称性，SiliconFlow 仅在 Web 路由侧生效，Backend 未引入 [1]。

幻灯片 4：关键大模型的 Fallback 链路实况

Gemini 链路：Backend 与 Web 保持一致，均严格按照 Google → Poe → OpenRouter 顺序回退 [1]。
GPT 链路：Web 链路按预期包含 Zenmux（Poe → OpenRouter → Zenmux → OpenAI），但 Backend 直接跳过了 Zenmux [1, 2]。
DeepSeek 链路：由于 Web 端特有加速，其回退链路包含了 SiliconFlow，而后端则直接通过 Poe 和 OpenRouter 调用 DeepSeek [2, 3]。

幻灯片 5：Web 端特有的高级路由机制

任务路由的引入：Web 端独有 task-model-router 和 SmartChat，实际调用动态依赖于 TaskType 的选择 [2, 3]。
服务级回退（Fallback）：Web 端不再完全依赖底层的统一路由回退，而是存在多个 API 显式通过 try/catch 实现的服务级 fallback [2]。
质量档位执行：原定的 Premium/Balanced/Fast 三档质量未被统一执行，Web 采用场景配置，而 Backend 仅依赖环境变量默认值 [2]。

幻灯片 6：PPT 图像生成链路的高度收敛

链路精简：相比起复杂的多模型 fallback 链，PPT 文生图链路变得更短、更具确定性 [2]。
Google 专用模型：在 PPT 图像场景下，Google 节点仅使用特定的 gemini-3-pro-image-preview 模型 [1, 3]。
Poe 专用模型：在同场景下，Poe 节点收敛为仅调用 nano-banana-pro [1, 3]。

幻灯片 7：代码证据索引与核对清单

后端逻辑溯源：核心链路可在 src/llm/model-router.ts 和 model-router-core.ts 中查证 [3]。
Web 端逻辑溯源：任务路由及服务级代码分布在 apps/web/lib/llm/ 及具体的 AI API 路由中 [3, 4]。
PPT 场景溯源：图像生成的专有链路逻辑可在 apps/web/lib/services/image-generation.ts 和生成 PPT 相关 API 中获取具体证据 [3]。

博客摘要 + 核心看点点击展开

MODEL_ROUTING_ARCHITECTURE_DIFF.md - 路由计划 vs 现实对照 — summary

SEO 友好博客摘要

本文深入对比了大模型路由架构的计划与现实实现 [1]。通过梳理代码发现，系统依然维持 Backend 与 Web 的双栈路由模式，并成功抽离了基础共享内核 [1]。文章详细剖析了 Zenmux、SiliconFlow 等平台在双端的 fallback 链路差异 [1, 2]，并揭示了 Web 端引入的任务路由机制及 PPT 文生图链路的精简收敛策略 [1, 3]。这为开发者优化 API 调用、排查模型容灾逻辑提供了真实的代码级对照指南。

核心看点