灵阙智能体平台 - Agent测试指南

原创灵阙教研团队

S 精选入门参考手册 | 约 6 分钟阅读更新于 2025-11-10

AI 导读

灵阙智能体平台 - Agent测试指南概述本指南将帮助您测试已集成的6个LLM提供商和Agent执行流程。所有后端API已打通，现在可以进行真实的测试。已完成的工作 1. 数据库准备创建测试用户: [email protected] 创建6个测试Agent (覆盖所有LLM提供商) 数据库schema同步完成 2. LLM服务集成增强LLM服务,支持6个提供商: OpenAI...

灵阙智能体平台 - Agent测试指南

概述

本指南将帮助您测试已集成的6个LLM提供商和Agent执行流程。所有后端API已打通，现在可以进行真实的测试。

🎉 已完成的工作

1. 数据库准备 ✅

✅ 创建测试用户: [email protected]
✅ 创建6个测试Agent (覆盖所有LLM提供商)
✅ 数据库schema同步完成

2. LLM服务集成 ✅

✅ 增强LLM服务,支持6个提供商:
- OpenAI (GPT-4, GPT-4o, GPT-4o-mini)
- Anthropic (Claude 3.5 Sonnet, Claude Opus)
- Kimi/Moonshot (moonshot-v1-8k, moonshot-v1-32k)
- Zhipu/智谱AI (glm-4, glm-4-plus)
- SiliconFlow (Qwen, DeepSeek)
- OpenRouter (多模型路由)

3. API端点 ✅

✅ /api/chat - 支持6种LLM提供商
✅ /api/agents - Agent管理
✅ /api/mcp/* - MCP工具调用
✅ /api/skills/execute - Skill执行

4. 前端集成 ✅

✅ Playground页面
✅ Agent选择器
✅ 流式/非流式响应支持

📋 测试前准备

1. 确认服务器运行

# 服务器应该已经在运行
# 访问: http://localhost:3000

2. 测试凭证

📧 邮箱: [email protected]
🔒 密码: Test1234
👤 用户ID: cmhlcflfl0000z4trvsh86vuz

🧪 测试步骤

步骤1: 登录系统

打开浏览器，访问: http://localhost:3000/login
输入测试凭证:
- 邮箱: [email protected]
- 密码: Test1234
点击"登录"

预期结果: 成功登录并跳转到工作台

步骤2: 进入Playground

在左侧导航栏点击 "Playground"
查看右侧配置面板

预期结果:

看到6个测试Agent
可以切换不同的Agent

步骤3: 测试不同的Agent

测试1: OpenAI GPT-4 Agent

选择Agent: "通用助手 (GPT-4)"
在输入框输入: 你好，请用一句话介绍你自己
点击发送或按 Cmd/Ctrl + Enter

预期结果:

收到GPT-4的回复
响应时间显示在消息下方
Token使用统计正常

测试2: Anthropic Claude Agent

选择Agent: "代码助手 (Claude)"
输入: 用Python写一个快速排序函数
发送消息

预期结果:

Claude生成完整的Python代码
代码格式正确
包含注释和说明

测试3: Kimi长上下文Agent

选择Agent: "中文助手 (Kimi)"
输入: 请用中文解释什么是量子计算
发送消息

预期结果:

Kimi提供详细的中文解释
语言流畅自然

测试4: 智谱GLM Agent

选择Agent: "智能分析师 (智谱GLM)"
输入: 分析一下2024年AI行业的发展趋势
发送消息

预期结果:

智谱AI提供结构化的分析
内容专业且有深度

测试5: 快速响应Agent

选择Agent: "快速问答 (GPT-4o-mini)"
输入: 1+1=?
发送消息

预期结果:

快速响应（< 1秒）
答案简洁准确

测试6: 发票OCR处理器

选择Agent: "发票OCR处理器"
上传一张发票图片（如果有）或输入: 如何提取发票信息？
发送消息

预期结果:

Agent给出发票处理的指导
模型使用gpt-4o（支持视觉输入）

步骤4: 测试流式响应

在配置面板中，找到"流式响应"开关
打开流式响应
发送一个长文本请求，例如: 请详细解释什么是深度学习，包括历史、原理和应用

预期结果:

文本逐字/逐词显示
流畅无卡顿
可以实时看到生成过程

步骤5: 测试对话历史

发送第一条消息: 我的名字是张三
发送第二条消息: 你还记得我叫什么吗？

预期结果:

Agent能够记住之前的对话内容
正确回答"张三"

🔍 问题排查

问题1: "Agent不存在或无权访问"

原因:

JWT token过期
用户未登录
Agent不属于当前用户

解决方案:

退出并重新登录
确认使用[email protected]登录
检查浏览器控制台是否有认证错误

问题2: API返回404

原因: 路由配置问题

解决方案:

检查开发服务器是否正常运行
查看终端输出是否有错误
访问 http://localhost:3000/api/agents 检查API是否可访问

问题3: LLM提供商报错

原因: API Key配置问题

解决方案:

检查 .env.local 文件中的API Key
确认API Key有效且有余额
查看服务器日志获取具体错误信息

问题4: 流式响应不工作

原因: SSE配置问题

解决方案:

检查浏览器是否支持SSE
查看网络面板是否有EventStream连接
尝试关闭流式响应使用非流式模式

📊 测试检查清单

功能测试

用户登录成功
Playground页面加载正常
可以看到6个测试Agent
可以切换不同Agent
发送消息成功
接收到LLM回复
对话历史记录正常
Token统计显示正确

LLM提供商测试

OpenAI GPT-4 工作正常
Anthropic Claude 工作正常
Kimi/Moonshot 工作正常
智谱GLM 工作正常
GPT-4o-mini 工作正常
发票OCR (GPT-4o) 工作正常

高级功能测试

流式响应工作正常
非流式响应工作正常
可以切换流式/非流式模式
响应时间统计正确
错误处理正常

🎯 测试目标

本次测试的主要目标是验证:

✅ 认证系统 - JWT认证正常工作
✅ Agent管理 - 可以创建、查询、使用Agent
✅ LLM集成 - 6个提供商全部可用
✅ 聊天功能 - 支持流式和非流式响应
✅ 数据持久化 - 对话历史正确保存

📝 测试报告

测试完成后，请记录以下信息:

成功的测试项

示例:
✅ OpenAI GPT-4 - 响应时间: 2.3秒, Token: 150
✅ Anthropic Claude - 响应时间: 3.1秒, Token: 250
✅ Kimi长上下文 - 响应时间: 1.8秒, Token: 180

失败的测试项

示例:
❌ 智谱GLM - 错误: API Key无效
❌ 流式响应 - 问题: 断开连接

性能指标

- 平均响应时间: ___ 秒
- Token使用效率: ___ tokens/消息
- 流式响应延迟: ___ ms

🔧 常用命令

查看服务器日志

# 日志会显示所有API请求和LLM调用
# 在运行npm run dev的终端中查看

重新播种测试数据

cd "/Users/mauricewen/Library/Mobile Documents/com~apple~CloudDocs/02 AI-Agent/灵阙智能体平台/agentic platform/apps/web"
npx tsx scripts/seed-test-data.ts

重启开发服务器

# Ctrl+C 停止当前服务器
npm run dev

📚 相关文档

API集成指南 - 查看所有API端点文档
API文档 - 完整的API参考
前端对话集成指南 - 前端实现细节

✨ 下一步

测试完成后，您可以:

创建自定义Agent - 使用自己的prompt和配置
集成MCP工具 - 添加文件系统、网络工具等
使用Skill系统 - 创建专用的AI技能
构建工作流 - 组合多个Agent完成复杂任务

🎉 总结

恭喜！您的灵阙智能体平台已经完全打通:

✅ 6个LLM提供商全部集成 ✅ 后端API完全可用 ✅ 前端界面功能完整 ✅ 数据库正确配置 ✅ 测试数据已准备

现在开始享受您的AI Agent平台吧！

猪哥云（四川）网络科技有限公司 | 合规网 www.hegui.com 猪哥云-数据产品部-Maurice | [email protected] 2025 猪哥云-灵阙企业级智能体平台

深度加工（NotebookLM 生成）

基于本文内容生成的 PPT 大纲、博客摘要、短视频脚本与 Deep Dive 播客，用于多场景复用

PPT 大纲（5-8 张幻灯片）点击展开

灵阙智能体平台 - Agent测试指南 — ppt

平台概述与已完成工作

本指南用于测试灵阙智能体平台已集成的6个LLM提供商和Agent执行流程 [1]。
数据库与测试用户已准备完毕，包含6个覆盖不同LLM提供商的测试Agent [1]。
成功打通所有后端API，支持聊天、Agent管理、MCP工具调用和Skill执行 [1]。
前端界面功能完整，Playground页面支持流式与非流式响应模式的切换 [1]。

测试前准备与系统登录

测试前需确认本地开发服务器正常运行并可通过浏览器访问端口 [1]。
使用预设测试凭证（邮箱：[email protected]）进行系统的登录验证 [1]。
成功登录后系统将跳转至工作台，进入左侧导航栏的 Playground 页面 [1]。
在配置面板中确认可以查看并切换预设的6个测试Agent [1]。

LLM提供商及Agent功能测试

验证多模型生态支持，覆盖OpenAI、Anthropic、Kimi、智谱GLM等提供商 [1, 2]。
测试不同专属Agent的表现，如代码助手生成Python代码、智能分析师输出结构化报告 [2]。
检查发票OCR处理器（基于GPT-4o视觉输入）的信息提取和图像处理能力 [2]。
确认系统能够正常统计并显示各提供商的响应时间与Token使用消耗 [2]。

高级交互功能测试

测试流式响应：开启开关后，验证长文本请求能否逐字/逐词流畅显示且无卡顿 [2, 3]。
测试非流式响应：确保系统可以在流式与非流式模式之间自由切换并输出结果 [3]。
验证对话历史记录：通过多轮连续提问，确认Agent具备正确的上下文记忆能力 [2, 3]。

常见问题排查指南

Agent无权访问：通常因JWT Token过期或未登录导致，需退出并使用测试账号重新登录 [2]。
API返回404错误：需检查开发服务器运行状态以及API路由配置是否正确 [2]。
LLM提供商报错：需检查环境变量文件中的 API Key 是否有效且有充足余额 [3]。
流式响应失效：建议排查浏览器SSE连接状态，或尝试关闭流式响应使用非流式模式 [3]。

测试目标与验收标准

本次测试的核心目标是验证认证系统、Agent管理、LLM集成、聊天功能及数据持久化五大模块 [3]。
需严格执行测试检查清单，确保从用户登录、Agent切换到提供商调用的全链路畅通 [3]。
测试完成后需生成测试报告，详细记录成功或失败的测试项、响应延迟及Token使用效率等性能指标 [3]。

下一步工作与生态扩展展望

创建自定义Agent：用户可以使用专属Prompt和配置打造个性化智能体 [4]。
集成MCP工具：引入文件系统、网络工具等，进一步拓展智能体的执行边界 [4]。
引入Skill系统：为平台创建并集成专用的AI底层技能 [4]。
构建复杂工作流：将多个Agent组合协同运作，完成更高阶复杂的业务场景任务 [4]。

博客摘要 + 核心看点点击展开

灵阙智能体平台 - Agent测试指南 — summary

SEO 友好博客摘要

本文是“灵阙智能体平台”完整的 AI Agent 测试指南，详解如何验证系统集成的 OpenAI、Claude、Kimi 等 6 大主流 LLM 及 Agent 执行流程[1]。指南覆盖从底层 API 端点到前端 Playground 的闭环测试，并提供流式响应、上下文记忆及 OCR 信息提取等核心功能的实操测试步骤[1, 2]。结合详尽的故障排查方案与检查清单，本指南是确保 AI 智能体稳定运行、构建复杂工作流的必备参考[2-4]。

核心看点