跳至主内容

AI 认知基础

提示词工程、模型原理、工具使用与开源精选

63 篇文章 | 5 个专题
难度
排序
类型

AI 认知基础

38 篇
A 进阶 深度解析 11 min

AI图像生成风格提示词矩阵

AI图像生成风格提示词矩阵 引言:从文本到视觉的工程化桥梁 AI图像生成已经从早期的"随机碰运气"进化为一门可系统化的工程实践。无论是产品经理为新功能制作概念图、设计师快速出原型、还是技术负责人为架构文档生成示意图,掌握结构化的风格提示词方法论都是核心竞争力。本文将从工程化视角出发,构建一套覆盖12种主流视觉风格的提示词矩阵,并针对Midjourney、DALL-E、Stable...

A 进阶 最佳实践 8 min

Few-Shot学习模式全解

Few-Shot学习模式全解 示例选择策略、动态 Few-Shot 构建与 In-Context Learning 的工程化实践 | 2026-02 一、什么是 Few-Shot Learning Few-Shot Learning(少样本学习)是通过在提示词中提供少量示例来引导 LLM 完成特定任务的技术。不同于传统机器学习的微调,Few-Shot 不修改模型权重,而是利用 LLM...

A 进阶 深度解析 9 min

Meta-Prompting:让AI优化AI的提示词

Meta-Prompting:让AI优化AI的提示词 自动化提示词优化、DSPy 框架与评估驱动的 Prompt 进化 | 2026-02 一、Meta-Prompting 的核心思想 Meta-Prompting 是用 LLM 来优化 LLM 的提示词。这不是一个新概念——它本质上是把"提示词工程"这个人类任务也交给 AI 来完成,形成自我改进的闭环。 Traditional Prompt...

A 进阶 深度解析 10 min

Prompt 自动优化:DSPy 与自动提示词工程(2026 年版)

Prompt 自动优化:DSPy 与自动提示词工程(2026 年版) 1. 引言 手工编写 Prompt 是一门"炼金术":凭经验调整措辞、添加示例、调整格式,通过反复试错达到满意的效果。这种方式存在三个根本问题: 不可复现:好的 Prompt 高度依赖编写者的经验和直觉 不可扩展:每换一个任务或模型,就要重新调整 不可评估:难以量化 Prompt A 比 Prompt B 好多少...

A 进阶 最佳实践 10 min

System Prompt设计模式

System Prompt设计模式 角色定义、约束规范、输出格式与版本管理的工程化设计模式 | 2026-02 一、System Prompt 的重要性 System Prompt 是 LLM 应用中最关键的"代码"——它定义了模型的行为边界、输出格式和交互风格。一个优秀的 System Prompt 应该像一份精准的岗位说明书:明确告诉模型你是谁、你做什么、你不做什么、你怎么做。...

A 进阶 深度解析 11 min

企业级 Prompt 管理平台设计(2026 年版)

企业级 Prompt 管理平台设计(2026 年版) 1. 引言 当企业的 AI 应用从 1 个增长到 100 个,Prompt 管理就不再是"一个文本文件"能解决的问题。散落在代码库、Notion 文档、个人笔记中的 Prompt 带来了一系列痛点:版本混乱、无法追踪效果、缺乏质量保证、知识无法共享。 企业级 Prompt 管理平台的目标是将 Prompt...

A 进阶 参考手册 11 min

创意提示词库:科技与设计融合

创意提示词库:科技与设计融合 引言:当工程思维遇见设计直觉 技术团队与设计团队之间的协作,长期存在一个翻译鸿沟——工程师用逻辑描述需求,设计师用感觉回应方案,两者的语言体系天然不同。AI生成工具的出现,意外地成为了这道鸿沟的桥梁:提示词同时承担了"工程规格"和"设计意图"的双重职能。...

A 进阶 最佳实践 12 min

多模态 Prompt 工程:图文音视频提示策略(2026 年版)

多模态 Prompt 工程:图文音视频提示策略(2026 年版) 1. 引言 多模态大模型(Multimodal LLMs)的快速发展正在重新定义 Prompt 工程的边界。传统的 Prompt 工程只处理纯文本输入和输出,而多模态 Prompt 工程需要同时操控文本、图像、音频、视频等多种信号的组合方式。 2024-2026 年间,GPT-4o、Claude 3.5/4、Gemini...

A 进阶 深度解析 15 min

多模态提示词工程

多模态提示词工程 Vision Prompting、音频输入、图文联合推理与多模态 Prompt 设计模式 | 2026-02 一、多模态 LLM 的能力边界 多模态大模型(如 GPT-4o、Claude 3.5、Gemini 2.0)能同时处理文本、图像、音频甚至视频。但"能处理"不等于"能处好"——多模态提示词工程的核心挑战是:如何让模型在不同模态之间建立正确的关联,而不是各看各的。...

A 入门 参考手册 10 min

多模态提示词设计指南

多模态提示词设计指南 面向视觉、音频、视频的多模态提示词工程实践 多模态 LLM 的能力边界 多模态大模型可以同时处理文本、图像、音频甚至视频输入。但每种模态的处理能力存在显著差异: 多模态能力矩阵(截至 2026 年初): 模型 文本 图像理解 图像生成 音频理解 音频生成 视频理解 视频生成 ─────────────── ──── ──────── ──────── ────────...

A 进阶 最佳实践 11 min

大模型幻觉控制的提示词策略

大模型幻觉控制的提示词策略 通过提示词工程降低 LLM 幻觉率:接地、引用、自检与多模型交叉验证 幻觉的本质 LLM 的幻觉(Hallucination)是指模型生成看似合理但实际上不准确或完全虚构的内容。理解幻觉的本质是有效控制它的前提。 幻觉分类 ┌──────────────────────────────────────────────────────────────┐ │ LLM...

A 入门 参考手册 13 min

思维链提示词:CoT / ToT / GoT 系统化指南(2026 年版)

思维链提示词:CoT / ToT / GoT 系统化指南(2026 年版) 1. 引言 大语言模型(LLM)在面对复杂推理任务时,直接给出答案的准确率往往不理想。2022 年,Google 的 Jason Wei 等人提出了 Chain-of-Thought(CoT)提示技术,通过引导模型"一步步思考"显著提升了推理能力。此后,Tree-of-Thought(ToT)和...

A 进阶 深度解析 12 min

提示词安全:注入攻击与防御

提示词安全:注入攻击与防御 Prompt Injection 攻防全解:攻击向量、防御策略与工程实践 提示词注入的本质 提示词注入(Prompt Injection)是 LLM 时代最核心的安全威胁之一。其本质是:LLM 无法区分"指令"和"数据"。 当用户输入被拼接到提示词中时,恶意输入可以劫持模型的行为。 传统 SQL 注入的类比: SQL 注入: 查询模板:SELECT * FROM...

A 进阶 深度解析 9 min

提示词注入防御工程

提示词注入防御工程 攻击分类、检测方法、防御架构与真实案例的工程化实践 | 2026-02 一、提示词注入的本质 提示词注入(Prompt Injection)是 LLM 应用面临的最严重安全威胁。其本质是:攻击者通过用户输入改变 LLM 的预设行为,类似于 SQL 注入在数据库层面的攻击。 Normal flow: System Prompt (developer) + User Input...

A 进阶 深度解析 14 min

提示词版本控制与AB测试

提示词版本控制与AB测试 Git-based Prompt 管理、在线评估、统计显著性与灰度发布策略 | 2026-02 一、为什么需要版本控制 提示词是 LLM 应用的"源代码",但大多数团队的提示词管理状态是:粘贴在代码里、Slack 里传来传去、改了不知道谁改的、回滚找不到上一版。 Without Version Control: Developer A edits prompt in...

A 进阶 深度解析 10 min

提示词版本管理与 A/B 测试

提示词版本管理与 A/B 测试 将提示词作为代码资产进行版本控制、回归测试和持续优化 为什么提示词需要版本管理 提示词在 LLM 应用中的地位等同于传统软件中的"业务逻辑代码"。一个提示词的微小修改可能导致输出质量的巨大变化。然而,大多数团队对提示词的管理仍然处于"复制粘贴"阶段。 提示词管理的成熟度模型: Level 0: 硬编码 提示词直接写在代码里,散落各处,无版本控制 Level 1:...

A 进阶 架构设计 9 min

提示词管理系统设计与实现

提示词管理系统设计与实现 从版本控制到生产部署:企业级 Prompt 管理系统的架构设计与工程实践 | 2026-02 一、为什么需要提示词管理 当 LLM 应用从原型进入生产,提示词就不再是"一段文字",而是核心业务逻辑的一部分。没有管理系统的提示词面临以下问题: 版本失控:谁改了提示词?改了什么?改坏了怎么回滚? 质量退化:新版本是否比旧版本好?没有对比就没有答案...

A 提升 最佳实践 7 min

提示词链编排:复杂任务的分治策略

提示词链编排:复杂任务的分治策略 Chain-of-Prompts、条件路由、错误传播与 LangChain LCEL 实现 | 2026-02 一、为什么需要提示词链 单个提示词在面对复杂任务时会遇到瓶颈:上下文窗口不够用、指令过于复杂导致遵循率下降、不同子任务需要不同的模型或参数。提示词链(Chain of Prompts)将复杂任务分解为多个简单步骤,每个步骤使用专门优化的提示词。...

A 进阶 深度解析 9 min

结构化提示词的工程化实践

结构化提示词的工程化实践 从自由文本到工程化模板:构建可维护、可测试、可复用的提示词体系 为什么需要结构化提示词 自由文本提示词的三大痛点: 不可预测:同一个意图的不同表述,LLM 可能给出完全不同质量的输出 不可维护:提示词散落在代码各处,修改一个提示词需要搜索整个代码库 不可复用:每个场景都从头写提示词,没有积累和沉淀 结构化提示词的目标:将提示词从"自然语言技巧"转变为"软件工程实践"。...

A 进阶 深度解析 8 min

结构化输出技术:让LLM返回可靠JSON

结构化输出技术:让LLM返回可靠JSON JSON Mode、Function Calling、Schema 验证与容错恢复的工程化实践 | 2026-02 一、为什么需要结构化输出 LLM 的默认输出是自然语言文本。但在工程系统中,下游组件需要的是可解析、可验证、可类型化的结构化数据。非结构化输出导致的问题: 解析失败:JSON 格式错误(多余逗号、未闭合括号) 字段缺失:LLM...

A 进阶 深度解析 11 min

结构化输出控制:JSON Mode 与 Schema 约束(2026 年版)

结构化输出控制:JSON Mode 与 Schema 约束(2026 年版) 1. 引言 大语言模型最初被设计为"自由文本生成器",其输出是非结构化的自然语言。然而在工程实践中,我们几乎总是需要结构化的输出:JSON 对象、数据库记录、API 响应、表格数据。如何可靠地从 LLM 获得结构化输出,是 Prompt 工程中最关键的实用技能之一。 2024-2026...

A 进阶 深度解析 18 min

评估驱动的提示词优化

评估驱动的提示词优化 Eval-First 开发、指标设计、自动评分、人工评估与持续改进闭环 | 2026-02 一、Eval-First 开发哲学 大多数提示词工程的失败模式是:先写 prompt,再想怎么评估,发现评不了就"看看效果还行"就上线了。正确的顺序是反过来的——先定义"什么是好",再去优化 prompt。 Wrong (Prompt-First): Write prompt ->...

A 进阶 对比评测 6 min

AI Agent 开发框架对比:LangGraph vs CrewAI vs AutoGen

AI Agent 开发框架对比:LangGraph vs CrewAI vs AutoGen 作者:Maurice | 灵阙学院 选型背景 2025-2026 年,AI Agent 开发框架从百花齐放走向收敛。对于技术团队来说,选择合适的框架直接影响开发效率和产品质量。本文对比三个主流开源框架的架构设计、适用场景和工程实践。 框架概览 维度 LangGraph CrewAI AutoGen...

A 提升 教程 18 min

AI IDE 工程规范:Cursor Rules 与 Claude Code 实战

AI IDE 工程规范:Cursor Rules 与 Claude Code 实战 作者:Maurice | 灵阙学院 为什么需要规范文件 2023 年以前,我们谈 AI 编程,谈的是"自动补全"。 2025 年,局面已经完全不同。Claude、GPT-4o、Gemini 这些模型的代码能力早已超过大多数初级工程师。Cursor、Claude Code、Windsurf 等 AI IDE...

A 进阶 教程 7 min

AI 工作流自动化实战

AI 工作流自动化实战 用 Dify 和 n8n 搭建三个实用 AI 工作流,无需写代码 Maurice | 灵阙学院 前置准备 Docker Desktop 已安装 基本的浏览器操作能力 一个 OpenAI / Claude / 国产大模型 API Key 一、AI 工作流工具全景对比 特性 Dify Coze (字节) n8n Make (Zapier) 定位 AI 应用开发平台 AI...

A 进阶 对比评测 6 min

AI 编程助手横向评测

AI 编程助手横向评测 Maurice | 灵阙学院 2026-02-27 | 评测窗口:2025-09 至 2026-02 评测背景 AI 编程助手已从"自动补全"进化到"自主工程"。本文对五款主流产品进行多维度横向对比,帮助开发者和团队做出选型决策。评测基于公开基准数据、社区反馈和实际使用体验综合判定。 产品概览...

A 进阶 深度解析 21 min

Context Engineering:从提示词到上下文工程

Context Engineering:从提示词到上下文工程 作者:Maurice | 灵阙学院 引言:一个范式正在悄悄替换另一个范式 2023年,"Prompt Engineering"(提示词工程)风靡一时。每个人都在学写更好的提示词,争论零样本还是少样本,研究思维链(Chain-of-Thought)的奇效。 2025年之后,顶级AI工程师开始使用另一个词:Context...

A 入门 参考手册 5 min

Function Calling 与工具使用开发指南

Function Calling 与工具使用开发指南 Maurice | 灵阙学院 2026-02-27 什么是 Function Calling Function Calling 让大模型不再只是输出文本,而是能够结构化地调用外部工具。模型根据用户请求决定调用哪个函数、传入什么参数,开发者执行函数后将结果返回模型,模型再基于结果生成最终回答。...

A 入门 参考手册 5 min

RAG 检索增强生成完全指南

RAG 检索增强生成完全指南 Maurice | 灵阙学院 2026-02-27 为什么需要 RAG 大语言模型有两个核心短板:知识截止日期和幻觉。RAG(Retrieval-Augmented Generation)通过在推理时注入外部知识,让模型基于真实文档回答问题,从根本上缓解了这两个问题。 与微调相比,RAG 不需要重新训练模型,知识更新只需替换文档库,成本低且可审计。...

A 进阶 深度解析 7 min

从零搭建你的第一个AI应用

从零搭建你的第一个AI应用 从环境搭建到部署上线,手把手带你完成第一个 AI 聊天应用 Maurice | 灵阙学院 前置准备 Python 3.10+ 一个 OpenAI 或 Anthropic API Key 基本的命令行操作能力 一、搭建 Python 开发环境 创建一个独立的虚拟环境,避免依赖冲突。 # 创建项目目录 mkdir my-first-ai-app && cd...

A 入门 对比评测 5 min

向量数据库选型指南

向量数据库选型指南 Maurice | 灵阙学院 2026-02-27 为什么需要专用向量数据库 传统数据库按精确匹配设计(WHERE id = 123),而 AI 应用需要按语义相似度检索("找到含义最接近的前 10 条记录")。向量数据库专为高维向量的近似最近邻(ANN)搜索优化,是 RAG、推荐系统、图像检索等 AI 应用的基础设施。 核心索引算法...

A 入门 参考手册 6 min

多模态 AI 应用开发指南

多模态 AI 应用开发指南 作者:Maurice | 灵阙学院 什么是多模态 AI 多模态 AI(Multimodal AI)是指能够理解和生成多种数据类型的 AI 系统——文本、图像、音频、视频的统一处理。 2024 年以前,不同模态通常需要不同的专用模型: 旧模式(模态隔离): 文本理解 → GPT-4 图像理解 → CLIP / BLIP-2 语音识别 → Whisper 图像生成 →...

A 提升 教程 6 min

提示词工程进阶:从 Chain-of-Thought 到 Tree-of-Thought

提示词工程进阶:从 Chain-of-Thought 到 Tree-of-Thought 作者:Maurice | 灵阙学院 提示词工程的三个阶段 阶段一:直接提示(2022 前) 直接向模型提问,依赖模型的"直觉": Q: 小明有 15 个苹果,给了小红 7 个,又买了 3 个,现在有几个? A: 11 个 问题:对于稍复杂的推理任务,直接提示的准确率显著下降。...

A 进阶 教程 6 min

本地部署大模型实战:Ollama 指南

本地部署大模型实战:Ollama 指南 在你自己的电脑上运行大语言模型,无需 API Key,完全离线可用 Maurice | 灵阙学院 前置准备 macOS (Apple Silicon 推荐) / Linux / Windows 至少 8GB 内存(运行 7B 模型) 推荐 16GB+ 内存(运行 13B+ 模型) 一、安装 Ollama macOS / Linux 一键安装: curl...

A 进阶 教程 15 min

结构化输出实战:让大模型输出可编程的 JSON

结构化输出实战:让大模型输出可编程的 JSON 作者:Maurice | 灵阙学院 前言 大模型最令人头疼的生产问题不是"输出错了",而是"输出了一个几乎正确的 JSON"。 漏了一个逗号,多了个 markdown 代码块围栏,把数字输出成字符串——这类问题不会在开发阶段暴露,专挑凌晨三点生产告警的时候出现。 本文系统梳理结构化输出的三种实现路径、各主流厂商 API 的落地方法、Pydantic...

A 进阶 深度解析 8 min

Prompt Contract v1.1 - 智能体平台结构化合约系统

Prompt Contract v1.1 - 智能体平台结构化合约系统 可校验、可编译、可回放的提示词工程化方案 概述 Prompt Contract v1.1 将传统的"散装提示词"升级为结构化合约,实现: 可校验:三层 Schema 校验(Envelope → Task → Result) 可编译:Prompt Compiler 自动注入 locks、negative、工具配置 可回放:同...

A 进阶 研究报告 13 min

LingQue Studio 智能体平台逐页优化与AI编程提示词(整合版)

逐页优化 & AI 编程提示词 LingQue Studio · 整合 HTML 0)全局 1)工作台 2)智能体列表 3)工作流编排 4)模板市场 5)会话记录 Beta 6)执行日志 7)链路追踪 New 8)测试中心 9)知识库 10)工具箱 11)MCP 服务 12)提示词库 13)模型接入 14)SOTA 榜单 New 15)订阅计划 New 16)租户管理 New 17)审计日志...

A 进阶 深度解析 7 min

智能体平台 Prompt Contract v1.1(YAML/JSON 硬约束 + 编排/校验/编译)

AI 编程指令:Prompt Contract v1.1(全平台 YAML/JSON 硬约束) v1.1 目标: 把“提示词”升级为可校验、可编译、可回放的结构化合约(Contract)。 所有输入/输出只允许严格 YAML 或严格 JSON,否则请求失败。 支持三类智能体:video / image / ppt,统一 Envelope + 任务内 Schema。...

AI 基础

13 篇
B 进阶 实战案例 13 min

企业AI开发工作流落地蓝图

企业级 AI 工作流 · 落地版 每个岗位如何把 AI 开发嵌入工作流 面向大中型研发组织的执行蓝图。核心不是“人人都去用 AI”,而是把岗位动作拆解为 信息处理、判断决策、执行产出 三层,先让 AI 吃掉高频、低风险、可验证、可模板化的环节, 再逐步进入复杂协同链路,最终沉淀为组织级平台能力。 战略原则 先嵌入,后重构 推进单位 岗位动作 核心路径 模板 + 门禁 + 度量 最终目标 组织级...

B 进阶 参考手册 9 min

研发黑话 Cheatsheet

研发黑话 Cheatsheet 给产品、研发、AI 应用、Agent、平台架构场景用的高频术语速查表。目标不是背词,而是知道每个词在团队里通常暗示什么。 研发流程 AI / Agent 架构与平台 数据与评估 工程效率 上线运维 01 基础研发黑话 02 AI / Agent 黑话 03 数据 / 检索 / RAG 04 架构 / 平台 / 系统 05 质量 / 测试 / 稳定性 06 项目管理...

B 进阶 深度解析 6 min

Notes: OpenClaw培训-S1-1.html UI/UX Optimization

Notes: OpenClaw培训-S1-1.html UI/UX Optimization Previous turn applied text-wrap: pretty for CJK typography. Added smooth hover transitions to cards. Fixed print styles. Need to verify button hierarchy...

B 进阶 深度解析 2 min

ROBOTS! -- Linda's Speech

WHAT'S HAPPENED? A little robot just droppeda secret note... It says: "Come learn about us!" Let's explore the world of ROBOTS! WHAT IS A ROBOT? Smart Machines That Move A robot is a smart machine It...

B 进阶 深度解析 2 min

Shenzhen: The City of Tomorrow -- Linda's Speech

ENGLISH SPEECH CONTEST 2026 ShenzhenThe City of Tomorrow Where Innovation Meets the Future Linda Wen (文婉甄) | Grade 3 | Qianhai Gangwan School | 前海港湾小学 GUESS WHAT? Have you ever seen a carwith NO...

B 进阶 深度解析 12 min

AI 编程工程方法论研究笔记(2026)

研究笔记 AI 编程 工程方法论 2026 版 AI 编程工程方法论研究笔记 这份文档把 2025–2026 年最有代表性的 AI-native 软件工程方法,压缩成一个可操作的研究框架:从 Spec、Context、Tool、Agent Workflow、Eval 到 Harness,最后收束到 Compound Engineering 的复利系统观。...

B 提升 研究报告 8 min

“龙虾热”背后的结构性成因:一份关于 OpenClaw 的深度思考报告

Deep Thinking Report “龙虾热”背后的结构性成因:一份关于 OpenClaw 的深度思考报告 这不是一份产品测评,而是一份结构判断:OpenClaw 引发的“龙虾热”,本质上是 Agent 被市场第一次大规模重估为“数字劳动力”和“新生产资料”的社会事件。 主题:OpenClaw / Agent / 新入口 时间锚点:2026 年 3 月 方法:现象拆解 + 产业结构推演...

B 入门 深度解析 1 min

Task Plan: OpenClaw培训-S1-1.html UI/UX Optimization

Task Plan: OpenClaw培训-S1-1.html UI/UX Optimization Objective Apply frontend UI/UX optimization SOP to OpenClaw培训-S1-1.html, ensuring high-quality composition, hierarchy, emphasis, and rhythm. Steps...

B 进阶 深度解析 11 min

Claude Code 官方工具全解(2026-03-15)

Claude Code 官方工具全解 基于 Anthropic 官方文档整理,日期:2026-03-15。 先纠偏:“Claude Code 官方有 20 个工具”这个说法,已经不是当前官方文档口径。Anthropic 现在的 Tools reference 页面列出了 30...

B 进阶 研究报告 18 min

Gemma 在中国 To-B 场景中的价值、边界与替代路线 | 调研报告

Briefing March 6th 2026 China Technology Gemma 在中国 To-B 场景中的价值、边界与替代路线 这不是一份"模型安利",而是一份更接近尽调的报告:它同时问技术、问法务、问业务, 问的不是"它聪不聪明",而是"它能不能真的被企业接住"。 真正的企业选型,常常不是在寻找最会背题的模型,而是在寻找那个更愿意被预算、流程、审计、...

B 提升 对比评测 6 min

OpenClaw 主动智能体竞赛:硅谷与中国大厂路线对比(深度研究)

OpenClaw 主动智能体竞赛:硅谷与中国大厂路线对比 从“更聪明的模型”到“更可靠的执行系统”:同一场竞赛,两套产业答案。 深度研究 经济学人风格 更新时间:2026-03-03 编号:OC-AGENT-260303 摘要 核心判断:OpenClaw...

B 进阶 研究报告 5 min

2028 全球智能危机与“幽灵 GDP” | 内参报告 III 期

企业技术 · 深度分析报告 · SPECIAL REPORT 2026 年 2 月 28 日 2028 全球智能危机与“幽灵 GDP” 内参报告 III 期 当 AI 的极致成功成为经济的绞肉机:一份来自未来的思想实验,如何在一夜之间蒸发了华尔街的数十亿市值?Citrini Research 备受争议的“智能替代螺旋”深度拆解。 作者:Maurice |...

B 提升 参考手册 11 min

AI & Agent 全栈概念速查表 4.0 (50+ 核心概念)

v4.0.0 - 50+ CONCEPTS EXPANDED AI & Agent 全栈概念速查表 全部 (50) 1. LLM 基础 (10) 2. 微调与对齐 (10) 3. Agent 架构 (10) 4. 工具与协议 (10) 5. 推理与工作流 (10) 1. LLM Core SOTA (最先进水平) 在特定任务中取得当前业界最高分数的模型。例如:当前闭源综合 SOTA 是...