智能体平台工程级规格说明（PRD + Tech Spec + API Spec）｜Claude Agent SDK + Skills + Workflow

原创灵阙教研团队

S 精选进阶参考手册 | 约 15 分钟阅读更新于 2025-12-28

AI 导读

智能体平台工程级规格说明（PRD + Tech Spec + API Spec） Claude Agent SDK + Skills + Workflow · 生成时间：2025-12-28 14:10 离线 HTML · 可打印/可收藏打印 / 导出 PDF 切换浅色/深色目录阅读建议：先看 PRD（做什么），再看 Tech Spec（怎么做），最后看 API Spec（怎么接）。...

智能体平台工程级规格说明（PRD + Tech Spec + API Spec）

Claude Agent SDK + Skills + Workflow · 生成时间：2025-12-28 14:10

离线 HTML · 可打印/可收藏打印 / 导出 PDF 切换浅色/深色

文档控制信息

文档名称	智能体平台工程级规格说明（PRD + Tech Spec + API Spec）
架构路线	Claude Agent SDK + Skills + Workflow（Control Plane / Data Plane 分离）
产品形态	交付物中心：Chat / Page / Canvas / Run 四工作区
目标平台	Web 优先（可扩展移动端），多语言
版本	v0.9（工程落地草案，可直接进入分工与拆任务）
生成时间	2025-12-28 14:10

范围声明：本规格说明面向“可复刻并上线”的工程实现，因此包含较多约束、数据模型、接口、状态机。具体细节可在实现期按业务变化做迭代，但建议保持核心抽象不变（Run / Artifact / Workflow / Skill / Tool）。

PRD｜产品需求说明

1. 背景与问题

用户想要的是可直接使用的成果（报告/PPT/海报/网站/脚本），而不是一段聊天记录。
单一对话式 AI 体验难以处理：长任务、并行任务、跨工具执行、审核/合规、多人协作。
竞品分化明显：Genspark 偏“页面化研究+工作台”、Lovart 偏“画布化创作”、Manus 偏“执行型虚拟同事”。

2. 产品愿景与目标

愿景

构建一个“从想法到交付”的通用智能体平台：既能研究、又能创作、还能执行，并且可复用、可治理、可集成。

核心目标（MVP 到 v1）

1) 交付物中心（Page/Canvas/Run）

2) Workflow 可复用（模板/版本/回放）

3) Skills 可上架（组织私有/公共市场）

4) Tool/MCP 治理（权限/审批/审计）

3. 非目标（明确不做）

不做“通用模型训练/自研基础大模型”（使用 Claude 等外部模型 + 可选企业自带模型路由）。
不在 v1 做“完全开放的用户自定义代码插件市场”（先做受控的 Skills + MCP 连接器）。
不在 v1 做“完全实时协同编辑（像 Figma 那样）”，先做“基于版本/评论的协作”。

4. 目标用户与角色

角色	典型诉求	关键功能
个人知识工作者	调研、总结、写报告、做 PPT	Page Workspace、引用、导出、模板
创作者/设计师	品牌套件、海报封面、视频脚本与分镜	Canvas Workspace、批注队列、变体、导出规格
开发者/数据分析师	自动化任务、代码生成、数据处理、部署	Run Workspace、终端/文件、checkpoint、可回放日志
团队管理员	成员/权限、连接器授权、用量与成本、审计	Org/RBAC、Connector 管理、Audit、用量仪表盘
集成开发者（B端）	把 Agent 接到业务系统：触发任务、接收结果	API + Webhook、Workflow Trigger、Artifact 下载

5. 关键产品原则

Artifact-first：成果是第一公民（Page/Canvas/Run 的产物可发布、可版本化、可审计）。
Human-in-the-loop：高风险动作必须审批（发送邮件、外部写入、支付、删除）。
Deterministic where it matters：关键步骤结构化输出（JSON Schema），可校验可重试。
Secure by default：默认最小权限；工具访问需显式授权；沙箱隔离。
Transparent cost：执行前给出 credits 预估；执行中给出成本分解。
Workflow as product：每个成功流程可一键固化为模板，成为可复用资产。

6. 核心体验：四工作区（Workspaces）

Chat Workspace（低门槛入口）

支持：多轮对话、附件、引用、流式输出、工具调用卡片、审批弹窗。
可一键升级为：Page/Canvas/Run（将当前对话上下文作为输入）。
典型 KPI：首次成功率、TTV（time-to-value）、付费转化率。

Page Workspace（研究/写作交付）

产物：结构化页面（标题/大纲/段落/表格/引用）。
功能：大纲导航、引用抽屉、Copilot（针对页面继续问答/改写）、发布与导出。
典型 KPI：页面被分享率、导出率、引用点击率、页面二次编辑率。

Canvas Workspace（创意/设计交付）

产物：无限画布上的“可编辑节点树”（图层、文本、组件、资源）。
交互三层：对话（Brief）→ 选区批注（指哪改哪）→ Inspector（参数微调）。
典型 KPI：变体采纳率、批注一次通过率、导出成功率、复用模板率。

Run Workspace（执行型项目交付）

产物：项目文件/脚本/表格/网页/ZIP 包，附执行日志与回放。
可见过程：Plan/Todos、Step timeline、Tool trace、Checkpoints、Resume/Fork。
典型 KPI：任务完成率、平均重试次数、平均耗时、错误可定位率。

7. 功能需求（FRD）分解

以下按模块列出 v1 需要交付的“工程可验收”功能点（每点可拆成 tickets）：

7.1 账号与组织（Auth/Org）

邮箱/第三方登录；可选 MFA（TOTP）。
组织：Org、Team、Project 多级归属；成员邀请、角色管理。
企业：SSO（OIDC/SAML）、域名验证、SCIM（后续）。

7.2 项目与产物（Project/Artifact）

Project：包含多个 Artifacts、Runs、Workflows、Skills 安装记录。
Artifact：Page/Canvas/Run-output/File 等类型；支持版本、标签、分享链接（权限）。
导出：PDF/MD/Docx/PNG/SVG/MP4/ZIP（按类型）。

7.3 Workflow Builder（可视化/DSL）

节点：Agent Step / Tool Step / Skill Step / Subagent Step / Human Step / Artifact Step。
触发：手动、定时（cron）、Webhook（外部系统触发）。
版本：每次发布生成 workflow_version，可回滚。
运行：workflow_run 可回放；节点支持重试、跳过、回滚策略。

7.4 Skills 市场（公共 + 组织私有）

Skill 包：描述、版本、所需工具权限、依赖、示例。
安装：组织/项目级安装；启用范围（所有项目/指定项目）。
审核：静态扫描 + 动态沙箱测试（见 Tech Spec）。

7.5 Tool/MCP 连接器

连接器授权：OAuth 授权、token vault、安全域隔离。
MCP Server：注册/启用/禁用/白名单；工具调用配额。
审批：对写入类工具默认需要审批（可由管理员策略调整）。

7.6 计费与用量（Billing/Metering）

套餐：Free / Pro / Team / Enterprise（可配置）。
Credits：统一点数（内部拆分 token/tool/compute/storage/concurrency）。
预估：Run/Workflow 启动前给出 cost estimate（范围 + 置信度）。
账单：用量明细、发票、团队分摊、预算报警。

7.7 可观测与合规（Obs/Audit）

Run trace：每一步的输入/输出摘要、工具参数、耗时、消耗。
审计：谁在何时授权了什么 connector、做了什么外部写入。
数据保留：按组织策略设置（7/30/180 天或自定义）。

8. 权限矩阵（简版）

能力	Viewer	Member	Admin	Owner
查看项目/产物	✅	✅	✅	✅
运行 Workflow / 发起 Run	❌	✅（受配额）	✅	✅
安装 Skills	❌	⚠️（项目级）	✅（组织级）	✅
连接器授权（OAuth）	❌	✅（个人 scopes）	✅（组织 scopes）	✅
设置审批策略/白名单	❌	❌	✅	✅
查看成本/用量报表	❌	⚠️（个人）	✅	✅

9. 成功指标（KPI）

Activation：D1 激活率（完成第一个可导出的交付物）、TTV（首次价值时间）。
Reliability：Run 完成率、平均重试次数、失败可定位率。
Efficiency：平均成本/任务、平均耗时、cache 命中率。
Growth：分享率、模板复用率、组织新增率。
Revenue：付费转化率、ARPA、credits 续费率。

10. 发布计划（建议节奏）

A：Run 执行层 + Tool trace + 审批 + Artifact store（先让“能干活”）
B：Page Workspace + 引用 + 发布/导出（研究交付闭环）
C：Canvas Workspace + 批注/Inspector/导出（创意交付闭环）
D：Workflow Builder + Skills Registry + Team 治理（平台化增长）

Tech Spec｜技术规格说明

1. 系统总体架构（Control/Data Plane）

复制
                ┌───────────────────────────┐
                │          Web / App         │
                │ Chat · Page · Canvas · Run │
                └─────────────┬─────────────┘
                              │ SSE/WS + REST
                       ┌──────▼──────┐
                       │ API Gateway  │  (AuthN, Rate limit, Idempotency)
                       └───┬─────┬───┘
                           │     │
              ┌────────────▼─┐ ┌─▼─────────────┐
              │ Identity/Org  │ │ Billing/Meter │
              │ RBAC/SSO      │ │ Credits/Ledger│
              └──────┬────────┘ └──────┬────────┘
                     │                 │
          ┌──────────▼──────────┐  ┌──▼────────────────┐
          │ Project/Artifact Svc │  │ Skill/Workflow Reg │
          │ DB + Object Storage  │  │ Version + Policy   │
          └──────────┬──────────┘  └──┬────────────────┘
                     │                │
                     │ enqueue steps  │
               ┌─────▼───────────────▼─────┐
               │        Workflow Engine     │
               │ DAG · retries · approvals  │
               └─────┬───────────────────┬─┘
                     │                   │
         ┌───────────▼──────────┐  ┌────▼───────────────────┐
         │ Workflow Workers      │  │ Agent Runtime Pool      │
         │ (K8s Jobs)            │  │ (Claude Agent SDK)      │
         └───────────┬──────────┘  └────┬───────────────────┘
                     │                  │
                 ┌───▼───┐          ┌───▼──────────┐
                 │ Tool  │  MCP     │ Sandbox/VM     │
                 │ Hub   ├──────────► Browser/Code    │
                 └───┬───┘          └───┬──────────┘
                     │                  │
               ┌─────▼──────────────┐   │
               │ Observability/Audit │◄──┘
               │ OTEL + Logs + Events│
               └─────────────────────┘

2. 服务拆分（建议微服务边界）

服务	职责	关键数据	扩展点
api-gateway	统一入口、鉴权、限流、幂等、版本路由	request_id, org_context	WAF、灰度发布、A/B
identity-org	用户、组织、RBAC、SSO/SCIM	users, orgs, memberships, roles	企业域名策略
project-artifact	项目、产物、版本、分享	projects, artifacts, versions, share_links	多存储后端
workflow	工作流模板、版本、运行、状态机	workflow_templates, workflow_versions, workflow_runs	可视化 builder
agent-runtime	运行 Claude Agent SDK 的执行面；session/compaction/checkpoint	run_sessions, run_steps, tool_calls	多模型路由
tool-hub	MCP 网关、连接器、token vault、工具配额/审批	connectors, tokens, tool_manifests	新增 MCP servers
billing-meter	订阅、credits、用量、账本	plans, subscriptions, credit_ledger, invoices	多币种、seat 管理
notify	站内通知、邮件、Webhook	notifications, webhooks	Slack/Teams
obs-audit	Tracing/Logs/Metrics、审计日志、报表	audit_logs, usage_stats	SIEM 对接

3. 数据存储与多租户

元数据：PostgreSQL（强一致，适合 RBAC、账本、状态机）。
缓存：Redis（session cache、rate limit、idempotency）。
产物：对象存储（S3/GCS/OSS），支持版本化。
向量：可选 Vector DB（pgvector/Milvus）用于企业知识库检索。
日志：OpenTelemetry → ClickHouse/Elastic（按规模选）。

多租户：所有主表必须有 org_id；服务层 enforce org context；对象存储路径包含 org_id/project_id；敏感字段加密（KMS）。

4. 核心数据模型（关键表）

表	关键字段（示例）	说明
`users`	id, email, name, locale, created_at	用户
`orgs`	id, name, plan_id, policy_json, created_at	组织/租户
`memberships`	org_id, user_id, role, status	组织成员
`projects`	id, org_id, name, description, created_by	项目空间
`artifacts`	id, org_id, project_id, type, title, latest_version_id	产物（Page/Canvas/File/RunOutput）
`artifact_versions`	id, artifact_id, storage_uri, meta_json, created_by	产物版本（对象存储 URI）
`runs`	id, org_id, project_id, workspace, status, model, cost_estimate	一次执行（Agent/Workflow）
`run_steps`	id, run_id, idx, type, status, started_at, ended_at	步骤状态机（可回放）
`tool_calls`	id, run_id, tool, input_json, output_json, cost	工具调用记录（审计/成本）
`approvals`	id, run_id, scope, status, requested_by, resolved_by	审批请求（写入/外部动作）
`workflow_templates`	id, org_id, name, visibility	工作流模板
`workflow_versions`	id, workflow_id, version, dag_json, created_by	工作流版本
`skills`	id, publisher_org_id, name, summary, visibility	技能（元信息）
`skill_versions`	id, skill_id, version, package_uri, manifest_json	技能包版本（含 SKILL.md）
`skill_installs`	id, org_id, skill_id, version_id, enabled_projects	安装记录
`connectors`	id, org_id, provider, status, scopes	连接器配置
`connector_tokens`	id, connector_id, encrypted_token, expires_at	OAuth token vault
`credit_ledger`	id, org_id, user_id, delta, reason, ref_id, created_at	点数账本（强一致）
`audit_logs`	id, org_id, actor_id, action, target, meta_json	审计日志

5. Run/Workflow 状态机（建议）

Run 状态机

复制
RUN_STATUS:
  QUEUED -> RUNNING -> (SUCCEEDED | FAILED | CANCELED)

Step:
  PENDING -> RUNNING -> (SUCCEEDED | FAILED | SKIPPED)
  FAILED -> RETRYING -> RUNNING ...

Approval:
  REQUESTED -> (APPROVED | DENIED | EXPIRED)

关键流程：启动 Run + 流式事件 + 产物落盘

复制
Client -> POST /v1/runs  (idempotency key)
  API Gateway -> Billing: preflight quota check
  Run Service -> create run + enqueue first step
Client -> GET /v1/runs/{run_id}/events (SSE)
Worker -> execute step (Agent SDK)
  -> tool calls via Tool Hub (may require approvals)
  -> write artifacts to Object Storage
  -> emit events (step_started/step_completed/artifact_created)
SSE -> client updates UI in real-time
On completion -> Billing: finalize metering + ledger entries

6. Workflow Engine 设计要点

DAG JSON：节点/边/输入输出 schema；节点声明重试策略与幂等键。
幂等：每个外部写入 Tool Step 必须带 idempotency_key；重复执行不产生重复副作用。
缓存：对确定性 Tool Step（例如抓取静态资料、标准化处理）可缓存，提升成本与速度。
Map‑Reduce：支持批处理子 agent 并行，Reduce 节点做汇总与校验。
Human Step：审批/补充输入；超时策略与 fallback。

7. Agent Runtime（Claude Agent SDK）平台化要点

运行隔离：K8s Job/Pod（资源限制、网络 egress 白名单、只读文件系统可选）。
Skills 装配：启动前把选中技能版本下载到 .claude/skills/ 并挂载。
Session/Resume：将 session_id 与 run_id 映射；支持暂停/继续；idle reclaim。
Compaction：长任务对话定期压缩（摘要写入 run_steps.meta_json）。
Checkpoint：关键文件/产物版本化；支持回滚与 diff（Run Workspace）。

8. Tool Hub（MCP 网关）与连接器治理

统一鉴权：Tool Hub 负责从 token vault 取凭证并注入调用。
最小权限：连接器 scopes 精确到资源/动作；默认只读。
审批策略：组织管理员可配置：哪些工具/动作必须审批；哪些免审批。
审计：每次 tool call 写入 tool_calls 与 audit_logs（必要时脱敏）。

9. 成本估算与计费扣减

Credits（资源点数）换算模型

对用户：显示一个 credits；对系统：拆成 5 个维度，便于治理与优化。

LLM tokens（按模型费率换算）
Tool 调用成本（外部 API / 抓取 / 搜索）
Compute（代码执行 / 视频渲染 / 大图）
Storage/Bandwidth（Drive/导出/分享）
Concurrency（并行 agent 数）

扣减策略：

启动前：preflight check（余额、并发额度、存储额度）→ 不足则 paywall。
执行中：按 step 记账（避免长任务结束才扣费造成欠费）。
结束后：对外部工具账单（可能延迟）做 reconciliation（补扣/退款）。

10. 安全、合规与风险控制

沙箱：执行面容器隔离；网络出站白名单；禁止访问内网地址（SSRF 防护）。
数据安全：token vault 加密；敏感字段加密；对象存储按 org 分桶或前缀隔离。
审批：对外部写入/发送/删除/支付动作必须审批（可配置）。
内容安全：输出前进行敏感检测（企业可自定义策略）。
审计：所有 connector 授权、审批、外部写入必须落审计日志。

11. 可观测与运维

Tracing：每个 run 作为 trace root，step/tool call 作为 span（OpenTelemetry）。
Metrics：完成率、耗时分布、失败原因 Top、缓存命中率、成本/任务。
Alert：失败率激增、超时、账本写入失败、队列积压、token vault 异常。

12. 测试与评测（建议必做）

单元测试：Workflow 节点解析、RBAC、账本、幂等。
集成测试：工具调用 mock、OAuth 流程、SSE 事件流。
回归评测：建立 Golden Tasks（研究/写作/设计/自动化），每次发布跑评测。
红队：工具滥用、越权、提示注入（Prompt Injection）、数据外泄测试。

API Spec｜接口规格说明（REST + SSE + Webhook）

1. 约定

Base URL：https://api.yourdomain.com
版本：/v1（重大变更使用 /v2）
认证：Bearer Token（JWT）或 API Key（服务端集成）
组织上下文：优先从 token 解析；可显式传 X-Org-Id
幂等：对创建/触发类接口支持 X-Idempotency-Key
分页：limit + cursor（返回 next_cursor）

2. 通用错误码

HTTP	code	含义	处理建议
400	`invalid_request`	参数缺失/格式错误	修正请求
401	`unauthorized`	未认证/Token 失效	刷新 token
403	`forbidden`	无权限	检查角色/策略
404	`not_found`	资源不存在	检查 ID
409	`conflict`	状态冲突/幂等冲突	重试或查询状态
422	`validation_error`	schema 校验失败	按字段提示修正
429	`rate_limited`	超出限流	指数退避重试
503	`overloaded`	系统过载	稍后重试/降级

3. 认证与 API Keys

API Key（服务端集成）

复制
POST /v1/api-keys
Authorization: Bearer <user_jwt>

Response 201
{"id":"key_01H..","prefix":"sk_live_****","created_at":"..."}

Use:
Authorization: Bearer sk_live_xxx

4. Projects

复制
POST /v1/projects
Headers:
  Authorization: Bearer ...
  X-Org-Id: org_...
  X-Idempotency-Key: ...

Body:
{"name":"竞品调研-Q1","description":"Genspark/Lovart/Manus","locale":"zh-CN"}

Response 201:
{"id":"proj_...","org_id":"org_...","name":"...","created_at":"..."}

5. Artifacts（产物/Drive）

创建 Page Artifact（结构化页面）

复制
POST /v1/projects/{project_id}/artifacts
Body:
{
  "type":"page",
  "title":"市场调研：Agent 平台",
  "content": {
    "schema":"page.v1",
    "blocks":[
      {"type":"heading","text":"摘要"},
      {"type":"paragraph","text":"..."}
    ]
  }
}

Response:
{"id":"art_...","type":"page","latest_version_id":"ver_..."}

上传文件（用于 Run/Workflow 输入）

复制
POST /v1/projects/{project_id}/artifacts
Content-Type: multipart/form-data
Fields:
  type=file
  file=@/path/data.csv
  title="sales.csv"

Response:
{"id":"art_...","type":"file","download_url":"..."}

6. Runs（执行/对话/流式事件）

启动 Run（可对应 Chat/Page/Canvas/Run 任一工作区）

复制
POST /v1/runs
Headers:
  Authorization: Bearer ...
  X-Org-Id: org_...
  X-Idempotency-Key: ...

Body:
{
  "project_id":"proj_...",
  "workspace":"run",
  "mode":"workflow",              // "agent" | "workflow"
  "workflow_version_id":"wfver_...", // optional
  "input": {
    "prompt":"抓取这份 CSV 并生成图表与总结报告",
    "artifacts":[{"id":"art_file_..."}]
  },
  "options": {
    "language":"zh-CN",
    "model":"claude-sonnet",     // router key or explicit
    "thinking":"auto",           // "fast" | "auto" | "deep"
    "max_cost_credits": 300
  }
}

Response 201:
{
  "id":"run_...",
  "status":"QUEUED",
  "cost_estimate": {"credits_low":80,"credits_high":180,"confidence":0.62},
  "events_url":"/v1/runs/run_.../events"
}

SSE 事件流（Run Workspace 必备）

复制
GET /v1/runs/{run_id}/events
Accept: text/event-stream

event: run.started
data: {"run_id":"run_...","ts":"..."}

event: step.started
data: {"step_id":"step_01","type":"agent_step","name":"Plan","ts":"..."}

event: tool.called
data: {"tool":"mcp.web.fetch","input":{"url":"..."},"ts":"..."}

event: approval.requested
data: {"approval_id":"appr_...","scope":"email.send","reason":"将向外部地址发送邮件"}

event: artifact.created
data: {"artifact_id":"art_...","type":"report","title":"分析报告.pdf"}

event: run.completed
data: {"status":"SUCCEEDED","cost":{"credits":143}}

审批（Approve/Deny）

复制
POST /v1/runs/{run_id}/approvals/{approval_id}/approve
Body:
{"comment":"同意发送"}

POST /v1/runs/{run_id}/approvals/{approval_id}/deny
Body:
{"comment":"不允许外发"}

7. Workflows（模板/版本/触发）

创建 Workflow Template

复制
POST /v1/workflows
Body:
{
  "name":"Wide Research - 竞品表格",
  "visibility":"org",
  "description":"对一组 URL 并行抓取并输出对比表"
}

Response:
{"id":"wf_...","latest_version":null}

发布 Workflow Version（DAG JSON）

复制
POST /v1/workflows/{workflow_id}/versions
Body:
{
  "version":"1.0.0",
  "dag": {
    "schema":"workflow.v1",
    "nodes":[
      {"id":"n1","type":"subagent_map","input_schema":"items.v1","config":{"model":"haiku","concurrency":50}},
      {"id":"n2","type":"agent_reduce","depends_on":["n1"],"config":{"model":"sonnet"}},
      {"id":"n3","type":"artifact_export","depends_on":["n2"],"config":{"format":"xlsx"}}
    ],
    "edges":[
      {"from":"n1","to":"n2"},
      {"from":"n2","to":"n3"}
    ]
  }
}

触发 Workflow Run

复制
POST /v1/workflows/{workflow_id}/runs
Body:
{
  "project_id":"proj_...",
  "version":"1.0.0",
  "input": {
    "items":[
      {"url":"https://.../a"},
      {"url":"https://.../b"}
    ]
  }
}

Response:
{"workflow_run_id":"wfrun_...","status":"QUEUED","events_url":"/v1/runs/run_.../events"}

8. Skills（市场/安装）

列出 Skills（公共市场 + org 私有）

复制
GET /v1/skills?visibility=public&limit=20

Response:
{
  "data":[
    {"id":"skill_...","name":"Brand Guard","latest_version":"1.2.0","summary":"品牌规范校验与修复"}
  ],
  "next_cursor": null
}

安装 Skill（组织级）

复制
POST /v1/orgs/{org_id}/skills/{skill_id}/install
Body:
{"version":"1.2.0","enable_projects":["proj_..."]}

Response:
{"install_id":"skinst_...","status":"ENABLED"}

9. Connectors / MCP Servers

启动 OAuth 授权

复制
POST /v1/orgs/{org_id}/connectors/{provider}/connect
Body:
{"scopes":["drive.read","drive.write"],"redirect_uri":"https://app.yourdomain.com/oauth/callback"}

Response:
{"auth_url":"https://accounts.google.com/o/oauth2/v2/auth?..."}

复制
POST /v1/orgs/{org_id}/mcp/servers
Body:
{
  "name":"internal-crm",
  "url":"https://mcp.company.com",
  "auth":"bearer",
  "allowed_tools":["crm.search","crm.update"],
  "egress_policy":"deny_all_except_list",
  "notes":"只允许在审批后写入"
}

10. Billing / Credits

查看 credits 余额与账本

复制
GET /v1/billing/credits
Response:
{"org_id":"org_...","balance":12500,"resets_at":"2026-01-01T00:00:00Z"}

GET /v1/billing/ledger?limit=50
Response:
{"data":[{"delta":-143,"reason":"run.completed","ref_id":"run_..."}]}

11. Webhooks（结果回调）

创建 Webhook

复制
POST /v1/webhooks
Body:
{
  "url":"https://yourapp.com/webhooks/agent",
  "events":["run.completed","artifact.created","approval.requested"],
  "secret":"whsec_..."
}

Response:
{"id":"wh_...","status":"ENABLED"}

Webhook Payload（示例：run.completed）

复制
POST https://yourapp.com/webhooks/agent
Headers:
  X-Signature: t=...,v1=...

Body:
{
  "event":"run.completed",
  "ts":"2025-12-28T12:00:00Z",
  "data": {
    "run_id":"run_...",
    "status":"SUCCEEDED",
    "project_id":"proj_...",
    "artifacts":[{"id":"art_...","type":"report","download_url":"..."}],
    "cost": {"credits":143}
  }
}

签名校验：建议 HMAC-SHA256，对 body + timestamp 计算签名，防重放攻击（客户端校验时间窗）。

附录｜可直接落地的模板与 DSL

A. Workflow DAG JSON（最小模板）

复制
{
  "schema":"workflow.v1",
  "nodes":[
    {
      "id":"plan",
      "type":"agent_step",
      "name":"Plan",
      "config": {"role":"planner","model":"sonnet","output_schema":"plan.v1"}
    },
    {
      "id":"execute",
      "type":"agent_step",
      "name":"Execute",
      "depends_on":["plan"],
      "config": {"role":"executor","model":"sonnet","tools_policy":"restricted"}
    },
    {
      "id":"verify",
      "type":"agent_step",
      "name":"Verify",
      "depends_on":["execute"],
      "config": {"role":"verifier","model":"opus","output_schema":"verify.v1"}
    },
    {
      "id":"export",
      "type":"artifact_export",
      "depends_on":["verify"],
      "config": {"format":"pdf","artifact_type":"report"}
    }
  ]
}

B. Skill 包 Manifest（建议字段）

复制
{
  "schema":"skill.manifest.v1",
  "name":"brand-guard",
  "version":"1.2.0",
  "summary":"品牌规范校验与修复",
  "entry":".claude/skills/brand-guard/SKILL.md",
  "required_tools":[
    "mcp.storage.read",
    "mcp.image.inspect",
    "mcp.page.edit"
  ],
  "risk_level":"medium",
  "policy": {
    "requires_approval_for":["mcp.storage.write","mcp.email.send"]
  },
  "tests":[
    {"name":"logo_clearspace","input":"...","expect":"pass"},
    {"name":"palette_check","input":"...","expect":"pass"}
  ]
}

C. Page DSL（示例）

复制
{
  "schema":"page.v1",
  "title":"竞品调研：Agent 平台",
  "blocks":[
    {"type":"heading","level":1,"text":"摘要"},
    {"type":"paragraph","text":"..."},
    {"type":"table","columns":["平台","定位","优势"],"rows":[["Genspark","页面化研究","..."]]},
    {"type":"citation","items":[{"title":"官方文档","url":"...","note":"..."}]}
  ]
}

D. Canvas Node Tree（示例）

复制
{
  "schema":"canvas.v1",
  "viewport": {"x":0,"y":0,"zoom":1},
  "nodes":[
    {"id":"frame1","type":"frame","x":0,"y":0,"w":1200,"h":800,"name":"Cover"},
    {"id":"img1","type":"image","parent":"frame1","x":80,"y":120,"w":520,"h":520,"asset_ref":"art_..."},
    {"id":"txt1","type":"text","parent":"frame1","x":640,"y":160,"w":480,"h":200,
      "style": {"font":"Inter","size":64,"weight":800,"color":"#111"},
      "text":"PIXEL VOGUE"}
  ],
  "comments":[
    {"id":"c1","node_id":"img1","text":"把主视觉调成更冷的蓝绿色","status":"queued"}
  ]
}

深度加工（NotebookLM 生成）

基于本文内容生成的 PPT 大纲、博客摘要、短视频脚本与 Deep Dive 播客，用于多场景复用

PPT 大纲（5-8 张幻灯片）点击展开

智能体平台工程级规格说明（PRD + Tech Spec + API Spec）｜Claude Agent SDK + Skills + Workflow — ppt

这是一份基于您提供的智能体平台工程级规格说明生成的 PPT 大纲，共包含 7 张幻灯片。

智能体平台项目概述与愿景

背景痛点：传统对话式 AI 难以处理长任务、并行任务及多人协作，且用户真正需要的是可直接使用的交付成果（如报告、PPT），而不仅是聊天记录 [1]。
平台愿景：构建一个“从想法到交付”的通用智能体平台，同时具备研究、创作与执行能力，并支持复用、治理与系统集成 [1]。
核心目标：以交付物（Page/Canvas/Run）为中心，实现 Workflow 的可复用（模板/版本），以及 Skills 的上架分发与 Tool/MCP 的安全治理 [1]。
产品边界：一期（v1）明确不做通用模型训练或自研基础大模型，也不做完全开放的用户自定义代码插件市场和绝对的实时协同编辑 [1, 2]。

目标用户与核心产品原则

多元用户群体：覆盖需要写报告的知识工作者、做设计的创作者、做自动化的开发者，以及管理团队和集成 API 的 B 端开发者 [2]。
成果优先 (Artifact-first)：将最终的成果作为平台的第一公民，所有工作区的产物均必须支持发布、版本化及审计 [2]。
人机协同与安全 (Human-in-the-loop & Secure)：高风险动作（如发送邮件、支付、外部写入等）强制要求审批，工具访问默认需显式授权并在沙箱隔离环境中运行 [2]。
成本透明与流程固化：任务执行前会提供成本预估（Credits），并且成功的流转过程可一键固化为 Workflow 模板成为核心数字资产 [2]。

核心体验：四大工作区设计

Chat Workspace（低门槛入口）：支持多轮对话、流式输出与工具调用卡片，并可将上下文一键平滑升级至后续的其他高级工作区 [2]。
Page Workspace（研究/写作闭环）：专为结构化页面产出设计，配备大纲导航、引用抽屉及 Copilot 智能改写辅助功能 [2]。
Canvas Workspace（创意/设计交付）：提供无限画布管理可编辑节点树，用户可通过对话提出需求（Brief），并利用选区批注实现“指哪改哪” [3]。
Run Workspace（执行型项目管理）：处理长程自动化任务，提供完全透明的执行过程日志（含时间线与工具追踪），并支持断点恢复 (Resume) 或分叉 (Fork) [3]。

平台级关键功能模块划分

灵活的工作流引擎 (Workflow Builder)：支持可视化及 DSL 两种定义方式，涵盖 Agent、工具、人工审批等多种节点，运行中节点均支持重试、跳过与回滚策略 [3]。
可控的技能市场 (Skills Registry)：支持在公共市场或组织私有范围内发布带有版本管理的 Skill 包，上架需经过静态扫描与动态沙箱双重测试审核 [3]。
安全的外部连接 (Tool/MCP 连接器)：采用独立 Token Vault 进行安全隔离管理，MCP 服务端实施严格的白名单注册制与工具调用配额控制 [3, 4]。
多级权限与项目管理 (Org & Project)：基于角色（RBAC）管控组织（Org/Team/Project）访问权限，最终产出可导出为多种工业标准格式（PDF/MD/SVG/MP4 等） [3]。

系统总体架构与关键技术分离

控制与数据面分离：采用 API Gateway 作为总控入口，统一处理鉴权 (AuthN)、限流及幂等性处理请求，确保前后端分离 [5]。
微服务化设计：系统划分为工作流引擎、资源/账户账本、项目与产物服务、工具网关以及可观测/审计等独立微服务 [5, 6]。
稳健的数据存储：核心元数据采用 PostgreSQL 保障强一致性，Redis 做高并发缓存，对象存储对接大体积文件产出，支持企业知识库向量检索扩展 [6, 7]。
执行面 (Agent Runtime)：K8s Job 提供底层容器隔离运行环境，结合 Claude Agent SDK，支持会话长上下文自动压缩 (Compaction) 及运行快照检查点 (Checkpoint) [5, 8]。

核心技术机制：状态机、计费与合规

高可靠运行状态机：精细定义 Run 与 Step 各个阶段的流转状态，并在工具触发阶段使用 idempotency_key 确保重复重试不产生副作用 [8, 9]。
五维成本结算模型：系统内部统一用 Credits 单位预估与扣减，但实际消耗会精确拆分到大模型 Tokens、API 工具调用、计算渲染、存储与并行度等 5 个维度 [10]。
全维度审计与观测 (Observability)：引入 OpenTelemetry 记录每步追踪（Tracing），针对系统越权动作、提示词注入及数据外泄等安全风险必须开展红队专项演练 [10]。
零信任沙箱防护：外部代码或抓取动作被限制在虚拟沙箱中执行，出站网络实施极简白名单策略以防御 SSRF 攻击风险 [10]。

平台发布计划与商业化指标评估

A阶段 (执行闭环)：优先跑通 Run 执行层、基础日志跟踪与人工审批流，确保平台能安全执行任务并沉淀产物 [4]。
B/C阶段 (场景扩展)：陆续引入 Page（研究导向）与 Canvas（视觉导向）两大工作区及其相应的成果格式闭环 [4]。
D阶段 (生态构建)：最终发布 Workflow 工作流编排、Skills 技能市场以及团队资源共享治理方案，推动生态平台化裂变 [4]。
核心 KPI (成功指标)：以用户完成首个有效成果时间（TTV）作为激活指标，考核运行重试次数与平均成功率，并以模板的被复用次数作为核心商业增长驱动力 [4]。

博客摘要 + 核心看点点击展开

智能体平台工程级规格说明（PRD + Tech Spec + API Spec）｜Claude Agent SDK + Skills + Workflow — summary

本文提供了一份工程级可落地的智能体平台（Agent Platform）全套规格说明，深度涵盖 PRD、Tech Spec 与 API Spec [1]。该平台基于 Claude Agent SDK 构建，采用控制面与数据面分离的先进架构 [1, 2]。系统以“交付物（Artifact）”为核心，提供 Chat、Page、Canvas 与 Run 四大工作区，全面满足调研总结、创意设计与自动化执行需求 [1, 3, 4]。结合可复用的 Workflow、组织级 Skills 市场及 MCP 工具治理体系，本文为研发团队打造安全合规、可商业化上线的企业级 AI 平台提供了权威参考 [1, 4-6]。

核心看点：

四大工作区驱动交付：首创 Chat、Page、Canvas 与 Run 工作区，告别单纯对话，实现“从想法到成果”的直接交付 [1, 3, 4]。
工程级标准架构设计：基于 Claude SDK 并采用控制与数据面分离，提供多租户、状态机、审计及详细 API 接口规范 [1, 2, 7, 8]。
完善的生态与权限治理：支持 Workflow 复用与 Skills 上架，内置 MCP 连接器与高风险动作审批机制，保障安全合规 [1, 3, 4, 9]。

60 秒短视频脚本点击展开