灵阙智能体平台 - 模型路由架构文档 (v1.4)

原创灵阙教研团队

A 推荐进阶参考手册 | 约 11 分钟阅读更新于 2026-02-06

AI 导读

灵阙智能体平台 - 模型路由架构文档版本: v1.4 | 更新日期: 2026-02-02 v1.4 更新增加官方模型清单优先（Official-First）：先同步官方 API models.list，再生成 registry；路由只认官方 model code；不存在/已弃用即 Fail-Closed。 Gemini 模型ID对齐：canonical 统一为 Google Gemini...

灵阙智能体平台 - 模型路由架构文档

版本: v1.4 | 更新日期: 2026-02-02

v1.4 更新

增加 官方模型清单优先（Official-First）：先同步官方 API models.list，再生成 registry；路由只认官方 model code；不存在/已弃用即 Fail-Closed。

Gemini 模型ID对齐：canonical 统一为 Google Gemini API 的 model code：gemini-3-pro-preview / gemini-3-flash-preview / gemini-3-pro-image-preview；Search Grounding 改为工具配置，不再使用虚构 gemini-3-pro-grounding。

修正 Poe/OpenRouter 命名映射：Poe 的 Gemini-3-Pro / Gemini-3-Flash 与图片模型 Nano-Banana-Pro 分离；Nano-Banana-Pro 仅用于 gemini-3-pro-image-preview。

Google TTS 模型ID对齐：gemini-2.5-pro-preview-tts / gemini-2.5-flash-preview-tts。

保持 2025-07-01 前模型硬禁用（v1.3）。

v1.3 更新

增加 2025-07-01 前模型硬禁用：路由层强校验 + registry 失败即拒绝（Fail-Closed）。

默认模型链与模型清单 全量迁移到 ≥2025-07：移除 gpt-4o* / o* / DALL·E 3 / Whisper v3 / Deepgram Nova-3 / text-embedding-3* / Cohere Rerank 3 / ElevenLabs v3 等旧型号。

Embedding/Rerank/Audio 更新：voyage-4-* + cohere-embed-v4.0；cohere-rerank-v4.0-*；STT 用 deepgram-flux / OpenAI gpt-audio-mini-2025-12-15；TTS 用 gemini-2.5-*-preview-tts / OpenAI gpt-audio-mini-2025-12-15。

更新 OpenRouter / Google AI Studio / Poe 的映射骨架到 GPT-5.2 / Claude 4.5 / Gemini 3 / Grok 4.1 / DeepSeek V3.2 / Qwen3-Coder。

v1.2 更新：基于 Arena.ai（LMArena）最新 Leaderboard（Text/Code/Vision/Search/Image/Video）重排默认模型链；新增 search / image_edit 场景；补齐 Grok 系列识别与 fallback；DeepSeek 升级 v3→v3.2；图片链更新到 gpt-image-1.5 / flux-2-max；视频链更新到 veo-3.1-audio / sora-2-pro。

v1.1 更新：删除5个免费 Google API 账号，仅保留 Ai-studio-jason（付费账号，2026-3-26到期）

v1.0 更新：引入质量档位（Premium/Balanced/Fast）、MoA多模型协作、视频/音频模型路由扩展

0. 硬性约束：2025-07-01 前模型禁用

0.1 规则

禁用阈值：MIN_MODEL_RELEASE_DATE = 2025-07-01
适用范围：LLM / Image / Video / Audio / Embedding / Reranker（所有“模型”一视同仁）
策略：Fail-Closed
- registry 未登记 releasedAt → 视为不合规，不可路由
- releasedAt < 2025-07-01 → 强制拒绝（不进入 fallback）

0.2 路由层校验（伪代码）

export const MIN_MODEL_RELEASE_DATE = '2025-07-01';

export type ModelMeta = {
  id: string;
  provider: string;
  releasedAt: string; // YYYY-MM-DD
  capabilities: Array<'text'|'vision'|'search'|'image'|'video'|'audio'|'embed'|'rerank'>;
};

export function assertModelAllowed(modelId: string, meta: ModelMeta) {
  if (!meta?.releasedAt) throw new Error(`MODEL_NOT_REGISTERED: ${modelId}`);
  if (meta.releasedAt < MIN_MODEL_RELEASE_DATE) throw new Error(`MODEL_BLOCKED_BY_POLICY: ${modelId}`);
}

0.3 旧模型输入的处理（兼容但不采用）

对外仍允许用户/上游传入旧 model 字段（避免上游崩溃）
进入路由层后：
- 直接拒绝（推荐）或
- 按别名迁移到新模型（可选，需显式开启 ALLOW_LEGACY_ALIAS_MIGRATION=true）

0.4 官方模型清单优先（强制）

canonical model id = 官方 API 返回的 model code（不是 Poe/OpenRouter 的“商品名”）
每次发布/启动必须跑完（Fail-Closed）：
1. sync：拉取官方 models.list
2. validate：存在 + 未弃用 + releasedAt >= 2025-07-01
3. map：生成 Poe/OpenRouter 的 别名映射（只做转换，不改变 canonical）

Gemini 3 命名对齐（示例）

Official (Google Gemini API)：gemini-3-pro-preview / gemini-3-flash-preview / gemini-3-pro-image-preview
Poe：Gemini-3-Pro / Gemini-3-Flash / Nano-Banana-Pro
OpenRouter：google/gemini-3-pro-preview / google/gemini-3-flash-preview / google/gemini-3-pro-image-preview

0.5 官方模型同步（伪代码）

// 目标：以官方 models.list 为准生成 registry，再由 registry 驱动路由。
// 注意：Google 返回的 model name 通常带 "models/" 前缀，统一剥离成 model code。

async function syncGoogleModels() {
  const url = `https://generativelanguage.googleapis.com/v1beta/models?key=${process.env.GOOGLE_API_KEY}`;
  const res = await fetch(url);
  if (!res.ok) throw new Error(`GOOGLE_MODELS_LIST_FAILED: ${res.status}`);
  const data = await res.json();

  const officialIds = new Set(
    (data.models ?? []).map((m: any) => String(m.name || '').replace(/^models\//, ''))
  );

  // Fail-Closed：如果 canonical 不在 officialIds 里，拒绝路由
  // assert(officialIds.has('gemini-3-pro-preview'))
}

1. 架构概览

┌─────────────────────────────────────────────────────────────────────────┐
│                        用户请求 (User Request)                           │
└─────────────────────────────────────┬───────────────────────────────────┘
                                      │
                                      ▼
┌─────────────────────────────────────────────────────────────────────────┐
│                    场景配置管理器 (ModelConfigManager)                    │
│                         lib/model-config.ts                             │
│  ┌─────────────────────────────────────────────────────────────────┐   │
│  │ 场景类型: chat | code | vision | search | image | image_edit | video | video_i2v | embedding | audio_stt | audio_tts | reranker │
│  └─────────────────────────────────────────────────────────────────┘   │
└─────────────────────────────────────┬───────────────────────────────────┘
                                      │
                                      ▼
┌─────────────────────────────────────────────────────────────────────────┐
│                      智能路由器 (SmartRouter)                            │
│                        lib/llm/smart-router.ts                          │
│  ┌─────────────────────────────────────────────────────────────────┐   │
│  │ 1. 识别模型系列 (ModelFamily)                                      │
│  │ 2. 获取路由配置 (RouteConfig)                                      │
│  │ 3. 校验模型存在 + 合规（officialListed && releasedAt >= 2025-07-01）                         │
│  │ 4. 获取已配置的 Fallback 链                                       │
│  │ 5. 按链路尝试 (Retry + Circuit Breaker)                            │
│  └─────────────────────────────────────────────────────────────────┘   │
└─────────────────────────────────────┬───────────────────────────────────┘
                                      │
                                      ▼
┌─────────────────────────────────────────────────────────────────────────┐
│                    Provider 执行层 (Poe/OpenRouter/原生)                 │
│  lib/llm/providers/*.ts  +  lib/llm/registry.ts                         │
└─────────────────────────────────────────────────────────────────────────┘

2. 场景默认模型配置

2.1 质量档位（Quality Tiers）

档位	目标	代表模型（参考 Arena 排名 + 可用性）
Premium	最高质量/复杂任务	Gemini 3 Pro Preview、Claude Opus 4.5 Thinking、Grok 4.1 Thinking、GPT-5.2 Pro
Balanced	默认体验	Gemini 3 Flash Preview、GPT-5.2、Claude Sonnet 4.5、DeepSeek V3.2
Fast	低时延/低成本	Gemini 3 Flash Preview (thinking-minimal)、GPT-5 mini、Claude Haiku 4.5、Grok 4.1 Fast

注：Leaderboard 的具体型号命名（带日期/-high/-thinking-32k 等）通过 alias 映射为“产品级短名”，以保持路由稳定。

2.2 场景默认模型配置（Balanced）

场景	场景类型	默认模型链	说明
对话交流	`chat`	`gemini-3-flash-preview → gpt-5.2 → claude-sonnet-4.5 → grok-4.1-fast`	Text Arena Top 区间内择优（默认性价比）
联网搜索	`search`	`gemini-3-pro-preview (grounding=google_search) → gpt-5.2 (web_search tool) → grok-4.1-fast (web_search tool)`	Search/grounding 优先
代码生成	`code`	`claude-opus-4.5-thinking → gpt-5.2-codex → deepseek-v3.2-thinking → qwen3-coder-480b-a35b`	agentic coding 优先
视觉理解	`vision`	`gemini-3-pro-preview → gemini-3-flash-preview → gpt-5.2`	Vision Arena Top 区间内择优
图片生成	`image`	`gpt-image-1.5 (fidelity=high) → gemini-3-pro-image-preview (imageSize=2K) → flux-2-max`	文字/排版优先；第二/三梯队兜底
图片编辑	`image_edit`	`chatgpt-image-latest (fidelity=high) → gemini-3-pro-image-preview (imageSize=2K) → gpt-image-1.5 (fidelity=high)`	Image Edit Arena Top 区间内择优
视频生成	`video`	`veo-3.1-audio → sora-2-pro → veo-3.1-fast-audio`	仅保留 ≥2025-07 的 T2V
向量嵌入	`embedding`	`voyage-4-large → cohere-embed-v4.0`	召回/检索（≥2025-07）
语音转文本	`audio_stt`	`deepgram-flux → gpt-audio-mini-2025-12-15`	流式优先；LLM 音频兜底
文本转语音	`audio_tts`	`gemini-2.5-pro-preview-tts → gemini-2.5-flash-preview-tts → gpt-audio-mini-2025-12-15`	低延迟/自然度优先
文本重排	`reranker`	`cohere-rerank-v4.0-pro → cohere-rerank-v4.0-fast`	RAG优化（≥2025-07）
工作流	`workflow`	`gemini-3-pro-preview → claude-opus-4.5-thinking → gpt-5.2`	推理、规划、工具调用

配置文件：lib/model-config.ts
强校验：lib/llm/model-guard.ts（新增，v1.3）

2.3 SOTA 快照（Arena.ai / LMArena）

数据来源：Arena.ai Leaderboards（以页面 Last Updated 为准）

Text（Last Updated Jan 29, 2026）：gemini-3-pro、grok-4.1-thinking、gemini-3-flash、claude-opus-4-5-20251101-thinking-32k、claude-opus-4-5-20251101
Code / WebDev（Last Updated Feb 1, 2026）：claude-opus-4-5-20251101-thinking-32k、gpt-5.2-high、claude-opus-4-5-20251101、gemini-3-pro、kimi-k2.5-thinking
Vision（Last Updated Jan 29, 2026）：gemini-3-pro、gemini-3-flash、gemini-3-flash (thinking-minimal)、gpt-5.2-high、gpt-5.1-high
Search（Last Updated Jan 29, 2026）：gemini-3-pro-grounding、gpt-5.2-search、gpt-5.1-search、grok-4-1-fast-search、grok-4-fast-search
Text-to-Image（Last Updated Jan 29, 2026）：gpt-image-1.5-high-fidelity、gemini-3-pro-image-preview-2k (nano-banana-pro)、gemini-3-pro-image-preview (nano-banana-pro)、flux-2-max、flux-2-flex
Image Edit（Last Updated Jan 29, 2026）：chatgpt-image-latest-high-fidelity (20251216)、gemini-3-pro-image-preview-2k (nano-banana-pro)、gemini-3-pro-image-preview (nano-banana-pro)、gpt-image-1.5-high-fidelity、seedream-4.5
Text-to-Video（Last Updated Jan 29, 2026）：veo-3.1-audio、sora-2-pro、veo-3.1-fast-audio、grok-imagine-video、veo-3-fast-audio

注：SOTA 快照只用于“排序参考”，最终可用性以 registry 为准；registry 未登记 releasedAt 的型号不会被路由使用（Fail-Closed）。

Arena 命名到 canonical 的关键映射（Gemini）：

gemini-3-pro → gemini-3-pro-preview

gemini-3-flash / gemini-3-flash (thinking-minimal) → gemini-3-flash-preview + thinkingLevel

gemini-3-pro-grounding → gemini-3-pro-preview + google_search grounding tool

gemini-3-pro-image-preview-2k (nano-banana-pro) → gemini-3-pro-image-preview + imageSize=2K

3. 模型系列识别规则

模型系列	识别规则	示例
OpenAI	`gpt-5`, `gpt-oss`, `gpt-image-1.5`, `chatgpt-image-latest`, `sora-2`, `gpt-audio`, `gpt-realtime*`	`gpt-5.2-pro`, `gpt-image-1.5`, `sora-2-pro`
Claude	`claude*`	`claude-sonnet-4.5`, `claude-opus-4.5-thinking`
Gemini	`gemini*`	`gemini-3-pro-preview`, `gemini-3-flash-preview`, `gemini-3-pro-image-preview`
Grok	`grok*`	`grok-4.1-thinking`, `grok-4.1-fast`
DeepSeek	`deepseek*`	`deepseek-v3.2`, `deepseek-v3.2-thinking`
Qwen	`qwen`, `qwen3-coder`	`qwen3-coder-480b-a35b`
Other	兜底	由 registry 决定

4. Fallback 路由链

4.1 路由策略: 聚合优先 (Aggregator-First)

模型系列	原生 Provider	Fallback 链 (按优先级)
OpenAI	OpenAI	`Poe → OpenRouter → OpenAI`
Claude	Anthropic	`Poe → OpenRouter → Anthropic`
Gemini	Google	`Google (Ai-studio-jason) → OpenRouter → Poe (Gemini-3-*)`
Grok	xAI	`Poe → OpenRouter → xAI`
DeepSeek	DeepSeek	`Poe → OpenRouter → DeepSeek`
Qwen	Alibaba/Vertex	`OpenRouter → VertexAI(MaaS) → Alibaba`
Other	-	`OpenRouter → Poe`

4.2 特殊处理: Google Gemini

仅保留付费账号 Ai-studio-jason（到期: 2026-03-26）。

文本/视觉：fallback 到 Poe Gemini-3-Pro / Gemini-3-Flash（按场景）

图片生成/编辑：fallback 到 Poe Nano-Banana-Pro（对应 gemini-3-pro-image-preview）

const GOOGLE_API_KEYS = [
  { email: 'Ai-studio-jason', priority: 0, expiresAt: '2026-03-26' },
];
// Gemini Text/Vision fallback 链: Google -> OpenRouter -> Poe (Gemini-3-*)
// Gemini Image fallback 链: Google -> Poe (Nano-Banana-Pro) -> OpenRouter

4.3 旧模型迁移表（可选开关）

默认不启用。启用后仅做“别名迁移”，实际仍受 releasedAt >= 2025-07-01 约束。

旧模型(禁用)	迁移到(可用)
`gpt-4o*`	`gpt-5.2` / `gpt-5-mini`
`o3` / `o4-mini`	`gpt-5.2-pro`
`dall-e-3`	`gpt-image-1.5` / `chatgpt-image-latest`
`whisper-v3` / `gpt-4o-mini-transcribe`	`deepgram-flux` / `gpt-audio-mini-2025-12-15`
`text-embedding-3-*`	`cohere-embed-v4.0` / `voyage-4-large`
`cohere-rerank-3*`	`cohere-rerank-v4.0-*`
`elevenlabs-v3*`	`gemini-2.5-*-preview-tts` / `gpt-audio-mini-2025-12-15`

5. 聚合平台 API 配置

平台	Base URL	环境变量
Poe	`https://api.poe.com/v1`	`POE_API_KEY`
OpenRouter	`https://openrouter.ai/api/v1`	`OPENROUTER_API_KEY`

5.1 原生 Provider API

Provider	Base URL	环境变量
OpenAI	`https://api.openai.com/v1`	`OPENAI_API_KEY`
Anthropic	`https://api.anthropic.com`	`ANTHROPIC_API_KEY`
Google	`https://generativelanguage.googleapis.com/v1beta`	`GOOGLE_API_KEY`
DeepSeek	`https://api.deepseek.com/v1`	`DEEPSEEK_API_KEY`
Cohere	`https://api.cohere.com`	`COHERE_API_KEY`
Voyage	`https://api.voyageai.com/v1`	`VOYAGE_API_KEY`
Deepgram	`https://api.deepgram.com`	`DEEPGRAM_API_KEY`

6. 模型ID转换映射

6.0 规则：官方优先，聚合只做别名

canonical model id 只允许来自 官方 API 的 model code
Poe/OpenRouter 仅负责把 canonical 转成平台可识别的别名
任何新增/变更：先跑 models.list 同步，再改路由；否则 CI 拒绝

6.1 Poe 平台模型映射（仅保留 ≥2025-07）

说明：Poe 的“产品名”以平台实际为准；此表只保留新型号骨架，旧型号不再登记。

const POE_MODEL_MAP = {
  // OpenAI / GPT-5
  'gpt-5.2': 'GPT-5.2',
  'gpt-5.2-pro': 'GPT-5.2-Pro',
  'gpt-5-mini': 'GPT-5-Mini',
  'gpt-5-nano': 'GPT-5-Nano',

  // Claude 4.5
  'claude-opus-4.5': 'Claude-Opus-4.5',
  'claude-sonnet-4.5': 'Claude-Sonnet-4.5',
  'claude-haiku-4.5': 'Claude-Haiku-4.5',

  // Gemini 3（官方 model code → Poe 商品名）
  'gemini-3-pro-preview': 'Gemini-3-Pro',
  'gemini-3-flash-preview': 'Gemini-3-Flash',

  // Gemini 3 Pro Image Preview（Nano Banana Pro）
  'gemini-3-pro-image-preview': 'Nano-Banana-Pro',

  // （可选）历史别名：不作为 canonical，仅用于迁移
  'nano-banana-pro': 'Nano-Banana-Pro',

  // DeepSeek / Qwen
  'deepseek-v3.2': 'DeepSeek-V3.2',
  'qwen3-coder-480b-a35b': 'Qwen3-Coder-480B',

  // Image
  'gpt-image-1.5': 'GPT-Image-1.5',
  'chatgpt-image-latest': 'ChatGPT-Image-Latest',
  'flux-2-max': 'FLUX-2-Max',

  // Video
  'sora-2-pro': 'Sora-2-Pro',
  'veo-3.1-audio': 'Veo-3.1-Audio',
};

6.2 OpenRouter 模型映射（已核对 ID 形态）

// 格式: provider/model-name
'gemini-3-pro-preview' -> 'google/gemini-3-pro-preview'
'gemini-3-flash-preview' -> 'google/gemini-3-flash-preview'
'gemini-3-pro-image-preview' -> 'google/gemini-3-pro-image-preview'
'claude-opus-4.5'      -> 'anthropic/claude-opus-4.5'
'claude-sonnet-4.5'    -> 'anthropic/claude-sonnet-4.5'
'claude-haiku-4.5'     -> 'anthropic/claude-haiku-4.5'
'gpt-5.2'              -> 'openai/gpt-5.2'
'gpt-5.2-pro'          -> 'openai/gpt-5.2-pro'
'grok-4.1-fast'        -> 'x-ai/grok-4.1-fast'

6.3 Google AI Studio 模型映射（去除 2.x/旧型号）

const GOOGLE_MODEL_MAP = {
  // Gemini 3（官方 model code）
  'gemini-3-pro-preview': 'gemini-3-pro-preview',
  'gemini-3-flash-preview': 'gemini-3-flash-preview',
  'gemini-3-pro-image-preview': 'gemini-3-pro-image-preview',

  // Search Grounding：不是模型ID，是 tools/config
  // 例：gemini-3-pro-preview + tools=[google_search]

  // TTS（Gemini TTS）
  'gemini-2.5-pro-preview-tts': 'gemini-2.5-pro-preview-tts',
  'gemini-2.5-flash-preview-tts': 'gemini-2.5-flash-preview-tts',
};

7. LLM 模型清单（仅含 ≥2025-07）

7.1 旗舰模型

模型	Provider	特点
Gemini 3 Pro Preview	Google	通用能力与长上下文强，Arena Text/Vision 顶部区间
GPT-5.2 Pro	OpenAI	高可靠推理/工具调用，Agent 主力
Claude Opus 4.5 (Thinking)	Anthropic	深度分析与代码高上限

7.2 主力/性价比模型

模型	Provider	特点
Gemini 3 Flash Preview	Google	快速、成本低、可开 minimal thinking
GPT-5.2	OpenAI	默认通用主力
GPT-5 mini	OpenAI	Fast 档位主力
Claude Sonnet 4.5	Anthropic	编程/代理强，综合性价比
Claude Haiku 4.5	Anthropic	极低延迟/高并发
Grok 4.1 Fast	xAI	大上下文 + 工具调用效率
DeepSeek V3.2	DeepSeek	工具调用/思维模式融合，性价比突出
Qwen3-Coder-480B-A35B	Qwen	代码/代理任务强（开源生态）

8. 其他模型类别（仅含 ≥2025-07）

8.1 图片生成/编辑

模型	Provider	说明
chatgpt-image-latest	OpenAI	Image Edit Arena Top；编辑/修复首选
gpt-image-1.5	OpenAI	文本渲染/指令跟随强
gemini-3-pro-image-preview	Google(Gemini 3)	Nano-Banana-Pro；中文文字/排版友好（图像生成/编辑）
flux-2-max	Black Forest Labs	高质感风格与真实感（Flux.2 系列）

说明：DALL·E 3 属于 <2025-07 旧型号，已移除。

8.2 Embedding

模型	Provider	说明
voyage-4-large	Voyage AI	新一代嵌入模型（召回质量优先）
cohere-embed-v4.0	Cohere	稳定、覆盖面广，作为第二路召回

说明：text-embedding-3-* 属于 <2025-07 旧型号，已移除。

8.3 Reranker

模型	Provider	说明
cohere-rerank-v4.0-pro	Cohere	质量优先
cohere-rerank-v4.0-fast	Cohere	低时延/低成本

8.4 Audio

模型	Provider	类型	说明
deepgram-flux	Deepgram	STT	流式对话/语音代理优先
gpt-audio-mini-2025-12-15	OpenAI	STT/TTS	通用音频兜底（LLM 音频）
gemini-2.5-pro-preview-tts	Google	TTS	自然度优先
gemini-2.5-flash-preview-tts	Google	TTS	低时延优先

8.5 Video（仅保留已知 ≥2025-07）

模型	Provider	说明
veo-3.1-audio	Google	带音频、叙事控制增强
sora-2-pro	OpenAI	高保真 T2V

9. 调用流程示例

// 1. 用户发起请求
const result = await smartRouter.chatCompletion({
  model: 'claude-sonnet-4.5',
  messages: [{ role: 'user', content: 'Hello' }],
});

// 2. SmartRouter 处理流程
// 2.1 识别模型系列: claude
// 2.2 获取路由配置: { fallbackChain: ['poe', 'openrouter', 'anthropic'] }
// 2.3 校验模型存在 + 合规（officialListed && releasedAt >= 2025-07-01）
// 2.4 按顺序尝试 Provider

// 3. 按链路尝试
// 尝试 Poe: claude-sonnet-4.5 -> Claude-Sonnet-4.5
// 如果失败 -> 尝试 OpenRouter: anthropic/claude-sonnet-4.5
// 如果失败 -> 尝试 Anthropic: claude-sonnet-4.5 (native)

// 4. 返回结果
console.log(result.actualProvider);
console.log(result.attemptedProviders);
console.log(result.errors);

10. 环境变量配置

# 聚合平台
POE_API_KEY=xxx
OPENROUTER_API_KEY=xxx

# 原生 Provider
OPENAI_API_KEY=xxx
ANTHROPIC_API_KEY=xxx
GOOGLE_API_KEY=xxx
DEEPSEEK_API_KEY=xxx

# 检索与排序
VOYAGE_API_KEY=xxx      # Embedding (Voyage-4)
COHERE_API_KEY=xxx      # Embed v4.0 + Rerank v4.0

# 音频
DEEPGRAM_API_KEY=xxx    # STT (Flux)

11. 核心文件索引

文件	职责
`lib/model-config.ts`	场景配置管理器
`lib/model-providers.ts`	模型定义库（registry + releasedAt）
`lib/llm/model-guard.ts`	v1.3 新增：合规校验（2025-07 截止）
`lib/llm/model-router.ts`	路由链定义 + 模型ID转换
`lib/llm/smart-router.ts`	智能路由器（自动 fallback）
`lib/llm/registry.ts`	Provider 注册表
`lib/llm/providers/*.ts`	各 Provider 实现
`lib/services/image-generation.ts`	图片生成服务（模型优先级 + 路由逻辑）

猪哥云（四川）网络科技有限公司 | 合规网 www.hegui.com
猪哥云-数据产品部-Maurice | [email protected]
2025 猪哥云-灵阙企业级智能体平台

深度加工（NotebookLM 生成）

基于本文内容生成的 PPT 大纲、博客摘要、短视频脚本与 Deep Dive 播客，用于多场景复用

PPT 大纲（5-8 张幻灯片）点击展开

灵阙智能体平台 - 模型路由架构文档 (v1.4) — ppt

这是基于您上传的《灵阙智能体平台 - 模型路由架构文档 (v1.4)》为您生成的 PPT 大纲。共包含 7 张幻灯片，严格按照您的格式要求输出。

灵阙智能体平台：模型路由架构 (v1.4) 概览

架构核心目标：构建支持多模态场景、具备高可用性与智能容灾（Fallback）的模型路由与调度中心 [1]。
v1.4 核心升级：引入“官方模型清单优先（Official-First）”策略，要求路由只识别官方 model code，并修正了多个聚合平台的命名映射 [2]。
多模态矩阵拓展：全面支持并更新了基于 2025 年 7 月后最新 SOTA 模型的文本、图像、视频、音频和检索链路 [2, 3]。
统一对齐标准：规范化 Gemini 等模型的 ID 格式，并将 Search Grounding 由虚构模型优化为正规的工具调用配置 [2]。

核心合规：2025-07-01 模型硬禁用策略

时间阈值红线：全平台所有大模型（包含 LLM、图片、音频、向量等）强制约束，发布时间（releasedAt）早于 2025-07-01 的模型被硬禁用 [2]。
Fail-Closed 强校验机制：路由层进行强制拦截，未登记发布时间或低于阈值的模型请求直接拒绝，绝不进入降级重试流程 [2]。
旧模型平滑过渡：兼容并允许前端或上游传入旧型号 ID（如 gpt-4o、dall-e-3），平台将其直接拦截或通过别名无缝迁移至合规的新模型（如 gpt-5.2、gpt-image-1.5）[4, 5]。

智能路由系统核心架构

场景配置管理 (ModelConfigManager)：精确识别请求场景，包含对话、代码开发、联网搜索、图片/视频生成编辑等十二大类型 [1, 6]。
智能路由器 (SmartRouter)：执行模型系列识别与路由配置获取，并在调度前完成合规性与存在性校验 [1]。
高可用调度机制：基于配置的 Fallback 链（重试与熔断机制），自动按顺序向各平台发起模型服务调用请求 [1]。
多平台执行层 (Provider)：底层无缝对接 Poe、OpenRouter 聚合平台以及原生官方 Provider [1, 7]。

场景配置与三大质量档位

Premium（极致质量档）：针对高复杂度推理任务，调用 Gemini 3 Pro Preview、Claude Opus 4.5、GPT-5.2 Pro 等旗舰模型 [6]。
Balanced（均衡主力档）：兼顾性能与成本的默认体验，配置 GPT-5.2、DeepSeek V3.2、Claude Sonnet 4.5 等高性价比模型 [6]。
Fast（极速低时延档）：面向高频并发需求，采用 GPT-5 mini、Grok 4.1 Fast、Claude Haiku 4.5 等敏捷型模型 [6]。
动态榜单驱动：各场景的“默认模型链”均依据 Arena.ai 的最新客观评测榜单（LMArena）动态排布并择优配置 [2, 3, 8]。

高可用 Fallback 兜底路由策略

聚合平台优先 (Aggregator-First)：主要模型系列的调用链默认优先走聚合平台以优化成本，标准链路为 Poe → OpenRouter → Native 原生 [9, 10]。
Google 渠道特殊处理：由于仅保留特定的付费账号，调用链定制为 Google → OpenRouter → Poe 且针对图文进行了细分处理 [2, 5]。
跨平台别名映射：通过严谨的映射字典，将 canonical 标准 ID（如 gemini-3-pro-image-preview）精准转换为 Poe（如 Nano-Banana-Pro）或 OpenRouter 的专用商品名 [4, 11, 12]。

官方驱动与注册表同步机制

唯一标准标识：系统的 canonical model id 强制且只允许使用官方 API 返回的规范化 model code [4, 7]。
自动同步与核验：系统每次发布和启动必须执行 models.list 官方清单同步，确保调用的模型存在且未被弃用 [4, 7]。
严格的准入控制：对任何新增或变更的模型，必须先完成官方同步和通过 CI 检查再修改路由规则，防范非法调用风险 [7]。

前沿多模态大模型选型矩阵

图像生成与编辑：采用文字排版能力强的 gpt-image-1.5、高质感逼真的 flux-2-max 及编辑首选 chatgpt-image-latest 组合兜底 [3, 13]。
视频生成新范式：清理旧版模型，全面换装带音频及叙事增强控制的 veo-3.1-audio 和高保真 sora-2-pro [3, 14]。
音频交互优化：使用流式对话优先的 deepgram-flux 负责语音识别（STT），gemini-2.5 系列负责自然且低延迟的语音合成（TTS） [3, 14]。
RAG 向量检索基石：全量升级至 2025 年下半年发布的 voyage-4-large 嵌入与 cohere-rerank-v4.0 重排技术 [2, 3]。

博客摘要 + 核心看点点击展开

灵阙智能体平台 - 模型路由架构文档 (v1.4) — summary

SEO 友好博客摘要

灵阙智能体平台正式发布模型路由架构 v1.4！本次升级聚焦架构合规与效能，全面实施“官方模型清单优先”策略，并强制拦截 2025 年 7 月前的旧版模型（Fail-Closed）以保障运行质量与安全[1, 2]。新架构凭借智能路由器的“聚合优先”策略与自动 Fallback 机制[3-5]，全面重塑了对话、视觉、视频及代码等多模态场景的默认链路，深度集成 Gemini 3、GPT-5.2、Claude 4.5 与 DeepSeek V3.2 等最新前沿大模型[6-8]。立即阅读本文，探索企业级 AI 多模型协作与智能路由的最新实践！

3 条核心看点