智能体平台工程级规格说明(PRD + Tech Spec + API Spec)|Claude Agent SDK + Skills + Workflow
AI 导读
智能体平台工程级规格说明(PRD + Tech Spec + API Spec) Claude Agent SDK + Skills + Workflow · 生成时间:2025-12-28 14:10 离线 HTML · 可打印/可收藏 打印 / 导出 PDF 切换浅色/深色 目录 阅读建议:先看 PRD(做什么),再看 Tech Spec(怎么做),最后看 API Spec(怎么接)。...
智能体平台工程级规格说明(PRD + Tech Spec + API Spec)
文档控制信息
| 文档名称 | 智能体平台工程级规格说明(PRD + Tech Spec + API Spec) |
|---|---|
| 架构路线 | Claude Agent SDK + Skills + Workflow(Control Plane / Data Plane 分离) |
| 产品形态 | 交付物中心:Chat / Page / Canvas / Run 四工作区 |
| 目标平台 | Web 优先(可扩展移动端),多语言 |
| 版本 | v0.9(工程落地草案,可直接进入分工与拆任务) |
| 生成时间 | 2025-12-28 14:10 |
PRD|产品需求说明
1. 背景与问题
- 用户想要的是可直接使用的成果(报告/PPT/海报/网站/脚本),而不是一段聊天记录。
- 单一对话式 AI 体验难以处理:长任务、并行任务、跨工具执行、审核/合规、多人协作。
- 竞品分化明显:Genspark 偏“页面化研究+工作台”、Lovart 偏“画布化创作”、Manus 偏“执行型虚拟同事”。
2. 产品愿景与目标
愿景
构建一个“从想法到交付”的通用智能体平台:既能研究、又能创作、还能执行,并且可复用、可治理、可集成。
核心目标(MVP 到 v1)
1) 交付物中心(Page/Canvas/Run)
2) Workflow 可复用(模板/版本/回放)
3) Skills 可上架(组织私有/公共市场)
4) Tool/MCP 治理(权限/审批/审计)
3. 非目标(明确不做)
- 不做“通用模型训练/自研基础大模型”(使用 Claude 等外部模型 + 可选企业自带模型路由)。
- 不在 v1 做“完全开放的用户自定义代码插件市场”(先做受控的 Skills + MCP 连接器)。
- 不在 v1 做“完全实时协同编辑(像 Figma 那样)”,先做“基于版本/评论的协作”。
4. 目标用户与角色
| 角色 | 典型诉求 | 关键功能 |
|---|---|---|
| 个人知识工作者 | 调研、总结、写报告、做 PPT | Page Workspace、引用、导出、模板 |
| 创作者/设计师 | 品牌套件、海报封面、视频脚本与分镜 | Canvas Workspace、批注队列、变体、导出规格 |
| 开发者/数据分析师 | 自动化任务、代码生成、数据处理、部署 | Run Workspace、终端/文件、checkpoint、可回放日志 |
| 团队管理员 | 成员/权限、连接器授权、用量与成本、审计 | Org/RBAC、Connector 管理、Audit、用量仪表盘 |
| 集成开发者(B端) | 把 Agent 接到业务系统:触发任务、接收结果 | API + Webhook、Workflow Trigger、Artifact 下载 |
5. 关键产品原则
- Artifact-first:成果是第一公民(Page/Canvas/Run 的产物可发布、可版本化、可审计)。
- Human-in-the-loop:高风险动作必须审批(发送邮件、外部写入、支付、删除)。
- Deterministic where it matters:关键步骤结构化输出(JSON Schema),可校验可重试。
- Secure by default:默认最小权限;工具访问需显式授权;沙箱隔离。
- Transparent cost:执行前给出 credits 预估;执行中给出成本分解。
- Workflow as product:每个成功流程可一键固化为模板,成为可复用资产。
6. 核心体验:四工作区(Workspaces)
Chat Workspace(低门槛入口)
- 支持:多轮对话、附件、引用、流式输出、工具调用卡片、审批弹窗。
- 可一键升级为:Page/Canvas/Run(将当前对话上下文作为输入)。
- 典型 KPI:首次成功率、TTV(time-to-value)、付费转化率。
Page Workspace(研究/写作交付)
- 产物:结构化页面(标题/大纲/段落/表格/引用)。
- 功能:大纲导航、引用抽屉、Copilot(针对页面继续问答/改写)、发布与导出。
- 典型 KPI:页面被分享率、导出率、引用点击率、页面二次编辑率。
Canvas Workspace(创意/设计交付)
- 产物:无限画布上的“可编辑节点树”(图层、文本、组件、资源)。
- 交互三层:对话(Brief)→ 选区批注(指哪改哪)→ Inspector(参数微调)。
- 典型 KPI:变体采纳率、批注一次通过率、导出成功率、复用模板率。
Run Workspace(执行型项目交付)
- 产物:项目文件/脚本/表格/网页/ZIP 包,附执行日志与回放。
- 可见过程:Plan/Todos、Step timeline、Tool trace、Checkpoints、Resume/Fork。
- 典型 KPI:任务完成率、平均重试次数、平均耗时、错误可定位率。
7. 功能需求(FRD)分解
以下按模块列出 v1 需要交付的“工程可验收”功能点(每点可拆成 tickets):
7.1 账号与组织(Auth/Org)
- 邮箱/第三方登录;可选 MFA(TOTP)。
- 组织:Org、Team、Project 多级归属;成员邀请、角色管理。
- 企业:SSO(OIDC/SAML)、域名验证、SCIM(后续)。
7.2 项目与产物(Project/Artifact)
- Project:包含多个 Artifacts、Runs、Workflows、Skills 安装记录。
- Artifact:Page/Canvas/Run-output/File 等类型;支持版本、标签、分享链接(权限)。
- 导出:PDF/MD/Docx/PNG/SVG/MP4/ZIP(按类型)。
7.3 Workflow Builder(可视化/DSL)
- 节点:Agent Step / Tool Step / Skill Step / Subagent Step / Human Step / Artifact Step。
- 触发:手动、定时(cron)、Webhook(外部系统触发)。
- 版本:每次发布生成 workflow_version,可回滚。
- 运行:workflow_run 可回放;节点支持重试、跳过、回滚策略。
7.4 Skills 市场(公共 + 组织私有)
- Skill 包:描述、版本、所需工具权限、依赖、示例。
- 安装:组织/项目级安装;启用范围(所有项目/指定项目)。
- 审核:静态扫描 + 动态沙箱测试(见 Tech Spec)。
7.5 Tool/MCP 连接器
- 连接器授权:OAuth 授权、token vault、安全域隔离。
- MCP Server:注册/启用/禁用/白名单;工具调用配额。
- 审批:对写入类工具默认需要审批(可由管理员策略调整)。
7.6 计费与用量(Billing/Metering)
- 套餐:Free / Pro / Team / Enterprise(可配置)。
- Credits:统一点数(内部拆分 token/tool/compute/storage/concurrency)。
- 预估:Run/Workflow 启动前给出 cost estimate(范围 + 置信度)。
- 账单:用量明细、发票、团队分摊、预算报警。
7.7 可观测与合规(Obs/Audit)
- Run trace:每一步的输入/输出摘要、工具参数、耗时、消耗。
- 审计:谁在何时授权了什么 connector、做了什么外部写入。
- 数据保留:按组织策略设置(7/30/180 天或自定义)。
8. 权限矩阵(简版)
| 能力 | Viewer | Member | Admin | Owner |
|---|---|---|---|---|
| 查看项目/产物 | ✅ | ✅ | ✅ | ✅ |
| 运行 Workflow / 发起 Run | ❌ | ✅(受配额) | ✅ | ✅ |
| 安装 Skills | ❌ | ⚠️(项目级) | ✅(组织级) | ✅ |
| 连接器授权(OAuth) | ❌ | ✅(个人 scopes) | ✅(组织 scopes) | ✅ |
| 设置审批策略/白名单 | ❌ | ❌ | ✅ | ✅ |
| 查看成本/用量报表 | ❌ | ⚠️(个人) | ✅ | ✅ |
9. 成功指标(KPI)
- Activation:D1 激活率(完成第一个可导出的交付物)、TTV(首次价值时间)。
- Reliability:Run 完成率、平均重试次数、失败可定位率。
- Efficiency:平均成本/任务、平均耗时、cache 命中率。
- Growth:分享率、模板复用率、组织新增率。
- Revenue:付费转化率、ARPA、credits 续费率。
10. 发布计划(建议节奏)
- A:Run 执行层 + Tool trace + 审批 + Artifact store(先让“能干活”)
- B:Page Workspace + 引用 + 发布/导出(研究交付闭环)
- C:Canvas Workspace + 批注/Inspector/导出(创意交付闭环)
- D:Workflow Builder + Skills Registry + Team 治理(平台化增长)
Tech Spec|技术规格说明
1. 系统总体架构(Control/Data Plane)
复制
┌───────────────────────────┐
│ Web / App │
│ Chat · Page · Canvas · Run │
└─────────────┬─────────────┘
│ SSE/WS + REST
┌──────▼──────┐
│ API Gateway │ (AuthN, Rate limit, Idempotency)
└───┬─────┬───┘
│ │
┌────────────▼─┐ ┌─▼─────────────┐
│ Identity/Org │ │ Billing/Meter │
│ RBAC/SSO │ │ Credits/Ledger│
└──────┬────────┘ └──────┬────────┘
│ │
┌──────────▼──────────┐ ┌──▼────────────────┐
│ Project/Artifact Svc │ │ Skill/Workflow Reg │
│ DB + Object Storage │ │ Version + Policy │
└──────────┬──────────┘ └──┬────────────────┘
│ │
│ enqueue steps │
┌─────▼───────────────▼─────┐
│ Workflow Engine │
│ DAG · retries · approvals │
└─────┬───────────────────┬─┘
│ │
┌───────────▼──────────┐ ┌────▼───────────────────┐
│ Workflow Workers │ │ Agent Runtime Pool │
│ (K8s Jobs) │ │ (Claude Agent SDK) │
└───────────┬──────────┘ └────┬───────────────────┘
│ │
┌───▼───┐ ┌───▼──────────┐
│ Tool │ MCP │ Sandbox/VM │
│ Hub ├──────────► Browser/Code │
└───┬───┘ └───┬──────────┘
│ │
┌─────▼──────────────┐ │
│ Observability/Audit │◄──┘
│ OTEL + Logs + Events│
└─────────────────────┘
2. 服务拆分(建议微服务边界)
| 服务 | 职责 | 关键数据 | 扩展点 |
|---|---|---|---|
| api-gateway | 统一入口、鉴权、限流、幂等、版本路由 | request_id, org_context | WAF、灰度发布、A/B |
| identity-org | 用户、组织、RBAC、SSO/SCIM | users, orgs, memberships, roles | 企业域名策略 |
| project-artifact | 项目、产物、版本、分享 | projects, artifacts, versions, share_links | 多存储后端 |
| workflow | 工作流模板、版本、运行、状态机 | workflow_templates, workflow_versions, workflow_runs | 可视化 builder |
| agent-runtime | 运行 Claude Agent SDK 的执行面;session/compaction/checkpoint | run_sessions, run_steps, tool_calls | 多模型路由 |
| tool-hub | MCP 网关、连接器、token vault、工具配额/审批 | connectors, tokens, tool_manifests | 新增 MCP servers |
| billing-meter | 订阅、credits、用量、账本 | plans, subscriptions, credit_ledger, invoices | 多币种、seat 管理 |
| notify | 站内通知、邮件、Webhook | notifications, webhooks | Slack/Teams |
| obs-audit | Tracing/Logs/Metrics、审计日志、报表 | audit_logs, usage_stats | SIEM 对接 |
3. 数据存储与多租户
- 元数据:PostgreSQL(强一致,适合 RBAC、账本、状态机)。
- 缓存:Redis(session cache、rate limit、idempotency)。
- 产物:对象存储(S3/GCS/OSS),支持版本化。
- 向量:可选 Vector DB(pgvector/Milvus)用于企业知识库检索。
- 日志:OpenTelemetry → ClickHouse/Elastic(按规模选)。
org_id;服务层 enforce org context;对象存储路径包含 org_id/project_id;敏感字段加密(KMS)。
4. 核心数据模型(关键表)
| 表 | 关键字段(示例) | 说明 |
|---|---|---|
users | id, email, name, locale, created_at | 用户 |
orgs | id, name, plan_id, policy_json, created_at | 组织/租户 |
memberships | org_id, user_id, role, status | 组织成员 |
projects | id, org_id, name, description, created_by | 项目空间 |
artifacts | id, org_id, project_id, type, title, latest_version_id | 产物(Page/Canvas/File/RunOutput) |
artifact_versions | id, artifact_id, storage_uri, meta_json, created_by | 产物版本(对象存储 URI) |
runs | id, org_id, project_id, workspace, status, model, cost_estimate | 一次执行(Agent/Workflow) |
run_steps | id, run_id, idx, type, status, started_at, ended_at | 步骤状态机(可回放) |
tool_calls | id, run_id, tool, input_json, output_json, cost | 工具调用记录(审计/成本) |
approvals | id, run_id, scope, status, requested_by, resolved_by | 审批请求(写入/外部动作) |
workflow_templates | id, org_id, name, visibility | 工作流模板 |
workflow_versions | id, workflow_id, version, dag_json, created_by | 工作流版本 |
skills | id, publisher_org_id, name, summary, visibility | 技能(元信息) |
skill_versions | id, skill_id, version, package_uri, manifest_json | 技能包版本(含 SKILL.md) |
skill_installs | id, org_id, skill_id, version_id, enabled_projects | 安装记录 |
connectors | id, org_id, provider, status, scopes | 连接器配置 |
connector_tokens | id, connector_id, encrypted_token, expires_at | OAuth token vault |
credit_ledger | id, org_id, user_id, delta, reason, ref_id, created_at | 点数账本(强一致) |
audit_logs | id, org_id, actor_id, action, target, meta_json | 审计日志 |
5. Run/Workflow 状态机(建议)
Run 状态机
复制
RUN_STATUS:
QUEUED -> RUNNING -> (SUCCEEDED | FAILED | CANCELED)
Step:
PENDING -> RUNNING -> (SUCCEEDED | FAILED | SKIPPED)
FAILED -> RETRYING -> RUNNING ...
Approval:
REQUESTED -> (APPROVED | DENIED | EXPIRED)
关键流程:启动 Run + 流式事件 + 产物落盘
复制
Client -> POST /v1/runs (idempotency key)
API Gateway -> Billing: preflight quota check
Run Service -> create run + enqueue first step
Client -> GET /v1/runs/{run_id}/events (SSE)
Worker -> execute step (Agent SDK)
-> tool calls via Tool Hub (may require approvals)
-> write artifacts to Object Storage
-> emit events (step_started/step_completed/artifact_created)
SSE -> client updates UI in real-time
On completion -> Billing: finalize metering + ledger entries
6. Workflow Engine 设计要点
- DAG JSON:节点/边/输入输出 schema;节点声明重试策略与幂等键。
- 幂等:每个外部写入 Tool Step 必须带
idempotency_key;重复执行不产生重复副作用。 - 缓存:对确定性 Tool Step(例如抓取静态资料、标准化处理)可缓存,提升成本与速度。
- Map‑Reduce:支持批处理子 agent 并行,Reduce 节点做汇总与校验。
- Human Step:审批/补充输入;超时策略与 fallback。
7. Agent Runtime(Claude Agent SDK)平台化要点
- 运行隔离:K8s Job/Pod(资源限制、网络 egress 白名单、只读文件系统可选)。
- Skills 装配:启动前把选中技能版本下载到
.claude/skills/并挂载。 - Session/Resume:将 session_id 与 run_id 映射;支持暂停/继续;idle reclaim。
- Compaction:长任务对话定期压缩(摘要写入 run_steps.meta_json)。
- Checkpoint:关键文件/产物版本化;支持回滚与 diff(Run Workspace)。
8. Tool Hub(MCP 网关)与连接器治理
- 统一鉴权:Tool Hub 负责从 token vault 取凭证并注入调用。
- 最小权限:连接器 scopes 精确到资源/动作;默认只读。
- 审批策略:组织管理员可配置:哪些工具/动作必须审批;哪些免审批。
- 审计:每次 tool call 写入
tool_calls与audit_logs(必要时脱敏)。
9. 成本估算与计费扣减
Credits(资源点数)换算模型
对用户:显示一个 credits;对系统:拆成 5 个维度,便于治理与优化。
- LLM tokens(按模型费率换算)
- Tool 调用成本(外部 API / 抓取 / 搜索)
- Compute(代码执行 / 视频渲染 / 大图)
- Storage/Bandwidth(Drive/导出/分享)
- Concurrency(并行 agent 数)
扣减策略:
- 启动前:preflight check(余额、并发额度、存储额度)→ 不足则 paywall。
- 执行中:按 step 记账(避免长任务结束才扣费造成欠费)。
- 结束后:对外部工具账单(可能延迟)做 reconciliation(补扣/退款)。
10. 安全、合规与风险控制
- 沙箱:执行面容器隔离;网络出站白名单;禁止访问内网地址(SSRF 防护)。
- 数据安全:token vault 加密;敏感字段加密;对象存储按 org 分桶或前缀隔离。
- 审批:对外部写入/发送/删除/支付动作必须审批(可配置)。
- 内容安全:输出前进行敏感检测(企业可自定义策略)。
- 审计:所有 connector 授权、审批、外部写入必须落审计日志。
11. 可观测与运维
- Tracing:每个 run 作为 trace root,step/tool call 作为 span(OpenTelemetry)。
- Metrics:完成率、耗时分布、失败原因 Top、缓存命中率、成本/任务。
- Alert:失败率激增、超时、账本写入失败、队列积压、token vault 异常。
12. 测试与评测(建议必做)
- 单元测试:Workflow 节点解析、RBAC、账本、幂等。
- 集成测试:工具调用 mock、OAuth 流程、SSE 事件流。
- 回归评测:建立 Golden Tasks(研究/写作/设计/自动化),每次发布跑评测。
- 红队:工具滥用、越权、提示注入(Prompt Injection)、数据外泄测试。
API Spec|接口规格说明(REST + SSE + Webhook)
1. 约定
- Base URL:
https://api.yourdomain.com - 版本:
/v1(重大变更使用 /v2) - 认证:Bearer Token(JWT)或 API Key(服务端集成)
- 组织上下文:优先从 token 解析;可显式传
X-Org-Id - 幂等:对创建/触发类接口支持
X-Idempotency-Key - 分页:
limit+cursor(返回next_cursor)
2. 通用错误码
| HTTP | code | 含义 | 处理建议 |
|---|---|---|---|
| 400 | invalid_request | 参数缺失/格式错误 | 修正请求 |
| 401 | unauthorized | 未认证/Token 失效 | 刷新 token |
| 403 | forbidden | 无权限 | 检查角色/策略 |
| 404 | not_found | 资源不存在 | 检查 ID |
| 409 | conflict | 状态冲突/幂等冲突 | 重试或查询状态 |
| 422 | validation_error | schema 校验失败 | 按字段提示修正 |
| 429 | rate_limited | 超出限流 | 指数退避重试 |
| 503 | overloaded | 系统过载 | 稍后重试/降级 |
3. 认证与 API Keys
API Key(服务端集成)
复制
POST /v1/api-keys
Authorization: Bearer <user_jwt>
Response 201
{"id":"key_01H..","prefix":"sk_live_****","created_at":"..."}
Use:
Authorization: Bearer sk_live_xxx
4. Projects
复制
POST /v1/projects
Headers:
Authorization: Bearer ...
X-Org-Id: org_...
X-Idempotency-Key: ...
Body:
{"name":"竞品调研-Q1","description":"Genspark/Lovart/Manus","locale":"zh-CN"}
Response 201:
{"id":"proj_...","org_id":"org_...","name":"...","created_at":"..."}
5. Artifacts(产物/Drive)
创建 Page Artifact(结构化页面)
复制
POST /v1/projects/{project_id}/artifacts
Body:
{
"type":"page",
"title":"市场调研:Agent 平台",
"content": {
"schema":"page.v1",
"blocks":[
{"type":"heading","text":"摘要"},
{"type":"paragraph","text":"..."}
]
}
}
Response:
{"id":"art_...","type":"page","latest_version_id":"ver_..."}
上传文件(用于 Run/Workflow 输入)
复制
POST /v1/projects/{project_id}/artifacts
Content-Type: multipart/form-data
Fields:
type=file
file=@/path/data.csv
title="sales.csv"
Response:
{"id":"art_...","type":"file","download_url":"..."}
6. Runs(执行/对话/流式事件)
启动 Run(可对应 Chat/Page/Canvas/Run 任一工作区)
复制
POST /v1/runs
Headers:
Authorization: Bearer ...
X-Org-Id: org_...
X-Idempotency-Key: ...
Body:
{
"project_id":"proj_...",
"workspace":"run",
"mode":"workflow", // "agent" | "workflow"
"workflow_version_id":"wfver_...", // optional
"input": {
"prompt":"抓取这份 CSV 并生成图表与总结报告",
"artifacts":[{"id":"art_file_..."}]
},
"options": {
"language":"zh-CN",
"model":"claude-sonnet", // router key or explicit
"thinking":"auto", // "fast" | "auto" | "deep"
"max_cost_credits": 300
}
}
Response 201:
{
"id":"run_...",
"status":"QUEUED",
"cost_estimate": {"credits_low":80,"credits_high":180,"confidence":0.62},
"events_url":"/v1/runs/run_.../events"
}
SSE 事件流(Run Workspace 必备)
复制
GET /v1/runs/{run_id}/events
Accept: text/event-stream
event: run.started
data: {"run_id":"run_...","ts":"..."}
event: step.started
data: {"step_id":"step_01","type":"agent_step","name":"Plan","ts":"..."}
event: tool.called
data: {"tool":"mcp.web.fetch","input":{"url":"..."},"ts":"..."}
event: approval.requested
data: {"approval_id":"appr_...","scope":"email.send","reason":"将向外部地址发送邮件"}
event: artifact.created
data: {"artifact_id":"art_...","type":"report","title":"分析报告.pdf"}
event: run.completed
data: {"status":"SUCCEEDED","cost":{"credits":143}}
审批(Approve/Deny)
复制
POST /v1/runs/{run_id}/approvals/{approval_id}/approve
Body:
{"comment":"同意发送"}
POST /v1/runs/{run_id}/approvals/{approval_id}/deny
Body:
{"comment":"不允许外发"}
7. Workflows(模板/版本/触发)
创建 Workflow Template
复制
POST /v1/workflows
Body:
{
"name":"Wide Research - 竞品表格",
"visibility":"org",
"description":"对一组 URL 并行抓取并输出对比表"
}
Response:
{"id":"wf_...","latest_version":null}
发布 Workflow Version(DAG JSON)
复制
POST /v1/workflows/{workflow_id}/versions
Body:
{
"version":"1.0.0",
"dag": {
"schema":"workflow.v1",
"nodes":[
{"id":"n1","type":"subagent_map","input_schema":"items.v1","config":{"model":"haiku","concurrency":50}},
{"id":"n2","type":"agent_reduce","depends_on":["n1"],"config":{"model":"sonnet"}},
{"id":"n3","type":"artifact_export","depends_on":["n2"],"config":{"format":"xlsx"}}
],
"edges":[
{"from":"n1","to":"n2"},
{"from":"n2","to":"n3"}
]
}
}
触发 Workflow Run
复制
POST /v1/workflows/{workflow_id}/runs
Body:
{
"project_id":"proj_...",
"version":"1.0.0",
"input": {
"items":[
{"url":"https://.../a"},
{"url":"https://.../b"}
]
}
}
Response:
{"workflow_run_id":"wfrun_...","status":"QUEUED","events_url":"/v1/runs/run_.../events"}
8. Skills(市场/安装)
列出 Skills(公共市场 + org 私有)
复制
GET /v1/skills?visibility=public&limit=20
Response:
{
"data":[
{"id":"skill_...","name":"Brand Guard","latest_version":"1.2.0","summary":"品牌规范校验与修复"}
],
"next_cursor": null
}
安装 Skill(组织级)
复制
POST /v1/orgs/{org_id}/skills/{skill_id}/install
Body:
{"version":"1.2.0","enable_projects":["proj_..."]}
Response:
{"install_id":"skinst_...","status":"ENABLED"}
9. Connectors / MCP Servers
启动 OAuth 授权
复制
POST /v1/orgs/{org_id}/connectors/{provider}/connect
Body:
{"scopes":["drive.read","drive.write"],"redirect_uri":"https://app.yourdomain.com/oauth/callback"}
Response:
{"auth_url":"https://accounts.google.com/o/oauth2/v2/auth?..."}
注册 MCP Server(企业自托管)
复制
POST /v1/orgs/{org_id}/mcp/servers
Body:
{
"name":"internal-crm",
"url":"https://mcp.company.com",
"auth":"bearer",
"allowed_tools":["crm.search","crm.update"],
"egress_policy":"deny_all_except_list",
"notes":"只允许在审批后写入"
}
10. Billing / Credits
查看 credits 余额与账本
复制
GET /v1/billing/credits
Response:
{"org_id":"org_...","balance":12500,"resets_at":"2026-01-01T00:00:00Z"}
GET /v1/billing/ledger?limit=50
Response:
{"data":[{"delta":-143,"reason":"run.completed","ref_id":"run_..."}]}
11. Webhooks(结果回调)
创建 Webhook
复制
POST /v1/webhooks
Body:
{
"url":"https://yourapp.com/webhooks/agent",
"events":["run.completed","artifact.created","approval.requested"],
"secret":"whsec_..."
}
Response:
{"id":"wh_...","status":"ENABLED"}
Webhook Payload(示例:run.completed)
复制
POST https://yourapp.com/webhooks/agent
Headers:
X-Signature: t=...,v1=...
Body:
{
"event":"run.completed",
"ts":"2025-12-28T12:00:00Z",
"data": {
"run_id":"run_...",
"status":"SUCCEEDED",
"project_id":"proj_...",
"artifacts":[{"id":"art_...","type":"report","download_url":"..."}],
"cost": {"credits":143}
}
}
附录|可直接落地的模板与 DSL
A. Workflow DAG JSON(最小模板)
复制
{
"schema":"workflow.v1",
"nodes":[
{
"id":"plan",
"type":"agent_step",
"name":"Plan",
"config": {"role":"planner","model":"sonnet","output_schema":"plan.v1"}
},
{
"id":"execute",
"type":"agent_step",
"name":"Execute",
"depends_on":["plan"],
"config": {"role":"executor","model":"sonnet","tools_policy":"restricted"}
},
{
"id":"verify",
"type":"agent_step",
"name":"Verify",
"depends_on":["execute"],
"config": {"role":"verifier","model":"opus","output_schema":"verify.v1"}
},
{
"id":"export",
"type":"artifact_export",
"depends_on":["verify"],
"config": {"format":"pdf","artifact_type":"report"}
}
]
}
B. Skill 包 Manifest(建议字段)
复制
{
"schema":"skill.manifest.v1",
"name":"brand-guard",
"version":"1.2.0",
"summary":"品牌规范校验与修复",
"entry":".claude/skills/brand-guard/SKILL.md",
"required_tools":[
"mcp.storage.read",
"mcp.image.inspect",
"mcp.page.edit"
],
"risk_level":"medium",
"policy": {
"requires_approval_for":["mcp.storage.write","mcp.email.send"]
},
"tests":[
{"name":"logo_clearspace","input":"...","expect":"pass"},
{"name":"palette_check","input":"...","expect":"pass"}
]
}
C. Page DSL(示例)
复制
{
"schema":"page.v1",
"title":"竞品调研:Agent 平台",
"blocks":[
{"type":"heading","level":1,"text":"摘要"},
{"type":"paragraph","text":"..."},
{"type":"table","columns":["平台","定位","优势"],"rows":[["Genspark","页面化研究","..."]]},
{"type":"citation","items":[{"title":"官方文档","url":"...","note":"..."}]}
]
}
D. Canvas Node Tree(示例)
复制
{
"schema":"canvas.v1",
"viewport": {"x":0,"y":0,"zoom":1},
"nodes":[
{"id":"frame1","type":"frame","x":0,"y":0,"w":1200,"h":800,"name":"Cover"},
{"id":"img1","type":"image","parent":"frame1","x":80,"y":120,"w":520,"h":520,"asset_ref":"art_..."},
{"id":"txt1","type":"text","parent":"frame1","x":640,"y":160,"w":480,"h":200,
"style": {"font":"Inter","size":64,"weight":800,"color":"#111"},
"text":"PIXEL VOGUE"}
],
"comments":[
{"id":"c1","node_id":"img1","text":"把主视觉调成更冷的蓝绿色","status":"queued"}
]
}
深度加工(NotebookLM 生成)
基于本文内容生成的 PPT 大纲、博客摘要、短视频脚本与 Deep Dive 播客,用于多场景复用
PPT 大纲(5-8 张幻灯片) 点击展开
智能体平台工程级规格说明(PRD + Tech Spec + API Spec)|Claude Agent SDK + Skills + Workflow — ppt
这是一份基于您提供的智能体平台工程级规格说明生成的 PPT 大纲,共包含 7 张幻灯片。
智能体平台项目概述与愿景
- 背景痛点:传统对话式 AI 难以处理长任务、并行任务及多人协作,且用户真正需要的是可直接使用的交付成果(如报告、PPT),而不仅是聊天记录 [1]。
- 平台愿景:构建一个“从想法到交付”的通用智能体平台,同时具备研究、创作与执行能力,并支持复用、治理与系统集成 [1]。
- 核心目标:以交付物(Page/Canvas/Run)为中心,实现 Workflow 的可复用(模板/版本),以及 Skills 的上架分发与 Tool/MCP 的安全治理 [1]。
- 产品边界:一期(v1)明确不做通用模型训练或自研基础大模型,也不做完全开放的用户自定义代码插件市场和绝对的实时协同编辑 [1, 2]。
目标用户与核心产品原则
- 多元用户群体:覆盖需要写报告的知识工作者、做设计的创作者、做自动化的开发者,以及管理团队和集成 API 的 B 端开发者 [2]。
- 成果优先 (Artifact-first):将最终的成果作为平台的第一公民,所有工作区的产物均必须支持发布、版本化及审计 [2]。
- 人机协同与安全 (Human-in-the-loop & Secure):高风险动作(如发送邮件、支付、外部写入等)强制要求审批,工具访问默认需显式授权并在沙箱隔离环境中运行 [2]。
- 成本透明与流程固化:任务执行前会提供成本预估(Credits),并且成功的流转过程可一键固化为 Workflow 模板成为核心数字资产 [2]。
核心体验:四大工作区设计
- Chat Workspace(低门槛入口):支持多轮对话、流式输出与工具调用卡片,并可将上下文一键平滑升级至后续的其他高级工作区 [2]。
- Page Workspace(研究/写作闭环):专为结构化页面产出设计,配备大纲导航、引用抽屉及 Copilot 智能改写辅助功能 [2]。
- Canvas Workspace(创意/设计交付):提供无限画布管理可编辑节点树,用户可通过对话提出需求(Brief),并利用选区批注实现“指哪改哪” [3]。
- Run Workspace(执行型项目管理):处理长程自动化任务,提供完全透明的执行过程日志(含时间线与工具追踪),并支持断点恢复 (Resume) 或分叉 (Fork) [3]。
平台级关键功能模块划分
- 灵活的工作流引擎 (Workflow Builder):支持可视化及 DSL 两种定义方式,涵盖 Agent、工具、人工审批等多种节点,运行中节点均支持重试、跳过与回滚策略 [3]。
- 可控的技能市场 (Skills Registry):支持在公共市场或组织私有范围内发布带有版本管理的 Skill 包,上架需经过静态扫描与动态沙箱双重测试审核 [3]。
- 安全的外部连接 (Tool/MCP 连接器):采用独立 Token Vault 进行安全隔离管理,MCP 服务端实施严格的白名单注册制与工具调用配额控制 [3, 4]。
- 多级权限与项目管理 (Org & Project):基于角色(RBAC)管控组织(Org/Team/Project)访问权限,最终产出可导出为多种工业标准格式(PDF/MD/SVG/MP4 等) [3]。
系统总体架构与关键技术分离
- 控制与数据面分离:采用 API Gateway 作为总控入口,统一处理鉴权 (AuthN)、限流及幂等性处理请求,确保前后端分离 [5]。
- 微服务化设计:系统划分为工作流引擎、资源/账户账本、项目与产物服务、工具网关以及可观测/审计等独立微服务 [5, 6]。
- 稳健的数据存储:核心元数据采用 PostgreSQL 保障强一致性,Redis 做高并发缓存,对象存储对接大体积文件产出,支持企业知识库向量检索扩展 [6, 7]。
- 执行面 (Agent Runtime):K8s Job 提供底层容器隔离运行环境,结合 Claude Agent SDK,支持会话长上下文自动压缩 (Compaction) 及运行快照检查点 (Checkpoint) [5, 8]。
核心技术机制:状态机、计费与合规
- 高可靠运行状态机:精细定义 Run 与 Step 各个阶段的流转状态,并在工具触发阶段使用
idempotency_key确保重复重试不产生副作用 [8, 9]。 - 五维成本结算模型:系统内部统一用 Credits 单位预估与扣减,但实际消耗会精确拆分到大模型 Tokens、API 工具调用、计算渲染、存储与并行度等 5 个维度 [10]。
- 全维度审计与观测 (Observability):引入 OpenTelemetry 记录每步追踪(Tracing),针对系统越权动作、提示词注入及数据外泄等安全风险必须开展红队专项演练 [10]。
- 零信任沙箱防护:外部代码或抓取动作被限制在虚拟沙箱中执行,出站网络实施极简白名单策略以防御 SSRF 攻击风险 [10]。
平台发布计划与商业化指标评估
- A阶段 (执行闭环):优先跑通 Run 执行层、基础日志跟踪与人工审批流,确保平台能安全执行任务并沉淀产物 [4]。
- B/C阶段 (场景扩展):陆续引入 Page(研究导向)与 Canvas(视觉导向)两大工作区及其相应的成果格式闭环 [4]。
- D阶段 (生态构建):最终发布 Workflow 工作流编排、Skills 技能市场以及团队资源共享治理方案,推动生态平台化裂变 [4]。
- 核心 KPI (成功指标):以用户完成首个有效成果时间(TTV)作为激活指标,考核运行重试次数与平均成功率,并以模板的被复用次数作为核心商业增长驱动力 [4]。
博客摘要 + 核心看点 点击展开
智能体平台工程级规格说明(PRD + Tech Spec + API Spec)|Claude Agent SDK + Skills + Workflow — summary
本文提供了一份工程级可落地的智能体平台(Agent Platform)全套规格说明,深度涵盖 PRD、Tech Spec 与 API Spec [1]。该平台基于 Claude Agent SDK 构建,采用控制面与数据面分离的先进架构 [1, 2]。系统以“交付物(Artifact)”为核心,提供 Chat、Page、Canvas 与 Run 四大工作区,全面满足调研总结、创意设计与自动化执行需求 [1, 3, 4]。结合可复用的 Workflow、组织级 Skills 市场及 MCP 工具治理体系,本文为研发团队打造安全合规、可商业化上线的企业级 AI 平台提供了权威参考 [1, 4-6]。
核心看点:
- 四大工作区驱动交付:首创 Chat、Page、Canvas 与 Run 工作区,告别单纯对话,实现“从想法到成果”的直接交付 [1, 3, 4]。
- 工程级标准架构设计:基于 Claude SDK 并采用控制与数据面分离,提供多租户、状态机、审计及详细 API 接口规范 [1, 2, 7, 8]。
- 完善的生态与权限治理:支持 Workflow 复用与 Skills 上架,内置 MCP 连接器与高风险动作审批机制,保障安全合规 [1, 3, 4, 9]。
60 秒短视频脚本 点击展开
智能体平台工程级规格说明(PRD + Tech Spec + API Spec)|Claude Agent SDK + Skills + Workflow — video
这是一份基于您上传的智能体平台规格说明为您定制的60秒短视频脚本:
【钩子开场】(14字)
告别聊天记录,AI直接交付成果![1]
【核心解说】
- 第一段(29字):
依托四大工作区,告别单调对话,直接产出可用的报告与设计画布。[1-3] - 第二段(29字):
工作流搭配技能市场,成功流程一键转模板,复杂任务轻松自动化。[2, 3] - 第三段(29字):
最小权限搭配审批机制,自动拦截高风险动作,全面保障企业安全。[2, 4, 5]
【收束句】
从想法到最终交付,真正的下一代通用智能体工作台来了![1]
课后巩固
与本文内容匹配的闪卡与测验,帮助巩固所学知识
延伸阅读
根据本文主题,为你推荐相关的学习资料