研发黑话 Cheatsheet

给产品、研发、AI 应用、Agent、平台架构场景用的高频术语速查表。目标不是背词,而是知道每个词在团队里通常暗示什么。

研发流程 AI / Agent 架构与平台 数据与评估 工程效率 上线运维

01 基础研发黑话

术语直白解释团队里真实含义
PRD
Product Requirement Document
需求文档不是“写个需求”这么简单,而是产品边界、场景、流程、规则、验收口径的统一依据。
MVP
Minimum Viable Product
最小可行产品不是简陋版,而是只保留验证核心假设所需的最小闭环。
POC
Proof of Concept
概念验证验证“技术上能不能做”,不负责商业闭环和可运营性。
Spike技术试刺短平快试验,先打穿未知点,不做长期工程承诺。
RFC
Request for Comments
设计提案文档大型改动上线前先公开方案,收评论,降低拍脑袋决策。
Schema数据结构约束定义“数据长什么样”,字段、类型、关系、约束都在里面。
Primitive / 原语基础能力单元能被反复组合的最小稳定构件,不是一个具体业务功能。
Abstraction抽象层把共性提炼成接口;抽象做对,复用和扩展才会快。
Boilerplate样板代码重复、基础、必要,但没有业务差异化价值。
Glue Code胶水代码负责把多个模块粘起来,常被低估,但在 AI 工作流里很关键。
Monorepo单体代码仓多个项目共用一个仓库;统一依赖、统一规范、统一 CI/CD。
Polyrepo多仓模式服务分仓管理,团队边界更清晰,但跨仓协作更碎。
判断一个词是不是“真的懂”,看能不能说清它解决什么问题、带来什么代价、适合什么阶段。

02 AI / Agent 黑话

术语直白解释团队里真实含义
Context模型当前可见的信息不只是窗口长度,还包括系统提示、历史消息、工具返回、检索结果。
Prompt Engineering提示词设计给模型施加结构化约束、角色、目标和格式,不等于“会说话”。
Harness实验 / 运行框架把输入、任务、评估、环境封装起来,让试验可批量、可重复、可回归。
Agent会规划和行动的系统不是普通对话机器人,而是能观察、决策、调用工具、执行任务的闭环体。
Tool Use工具调用模型不只“说”,还会查、写、调 API、读文件、执行命令。
Planner规划器负责拆任务、定步骤;强规划不等于强执行。
Executor执行器按计划调工具、做动作;很多 Agent 失败不是不会想,而是执行落不下去。
Reflection反思模型对自己结果做二次检查;用于降低粗糙输出和错误路径。
Memory记忆机制短期记忆存会话状态,长期记忆存偏好、事实、经验,不等于简单聊天记录。
Router路由器决定任务交给哪个模型、工具、工作流或子 Agent。
Subagent子智能体把复杂任务拆给多个角色化执行单元,并行或分层协作。
Eval评估体系验证改动到底变好还是变差。没有 eval,Agent 研发基本靠感觉。
LLM-as-a-Judge模型当裁判用模型给模型打分,适合主观质量评估,但必须防偏差和提示污染。
Grounding让输出有依据把模型回答绑定到外部知识、文档、检索或工具结果,降低胡编。
Hallucination幻觉模型说得像真的,但依据并不存在;不是“答错”这么简单,而是伪确定性。
Compaction上下文压缩把长对话或历史轨迹压成更短摘要,控制 token 成本与注意力衰减。
AI 团队里最常见伪理解:把 Agent 等同于聊天机器人,把 prompt 优化等同于系统能力建设。

03 数据 / 检索 / RAG

术语直白解释团队里真实含义
RAG
Retrieval-Augmented Generation
检索增强生成先找资料,再让模型生成答案,核心是“找得对”和“用得好”。
Chunking切块把长文档切成可检索小段;切法决定召回质量上限。
Embedding向量表示把文本映射到语义空间,便于相似检索;不是“压缩成数组”这么浅。
Recall召回相关内容有没有被找回来;RAG 第一关。
Precision精准率找回来的内容是不是足够相关;召回太宽会污染上下文。
Rerank重排对初步召回结果二次排序,把更相关的片段顶上来。
Top-K取前 K 条检索返回多少条候选;K 太小漏信息,太大加噪声。
Hybrid Search混合检索关键词检索 + 向量检索,一般比单一路径更稳。
术语直白解释团队里真实含义
Vector DB向量数据库存 embedding 和索引,用于相似检索,但它本身不等于“知识库”。
Knowledge Graph知识图谱用实体、关系、属性表达结构化知识,适合推理与约束,不只是画图。
Ontology本体定义“世界里有哪些类、关系、约束”,是图谱和语义系统的规则层。
Metadata元数据描述数据的数据,如作者、时间、来源、标签;过滤和追溯很依赖它。
Ground Truth标准真值评估时作为对照答案的权威标注。
Data Drift数据漂移线上数据分布变了,原来的效果不再成立。
Freshness新鲜度知识是否及时更新;新闻、政策、价格场景尤其致命。
Coverage覆盖度知识库有没有覆盖真实用户会问的问题域。
RAG 常见误区:把“向量库接上了”当成知识系统完成。真正难点是切块、召回、重排、引用、时效、权限、评估闭环。

04 架构 / 平台 / 系统

术语直白解释团队里真实含义
API-first接口优先先定义接口契约,再做实现,方便平台化和外部集成。
Contract接口契约前后端、服务与服务之间对输入输出的明确约定。
Backward Compatibility向后兼容升级后不把老调用方搞挂。
Idempotency幂等重复调用多次,结果等价;支付、任务重试、消息消费里很关键。
Stateless无状态单次请求不依赖本机历史状态,便于扩容和容灾。
Stateful有状态状态要被保存和管理,复杂度更高,但某些业务不可避免。
Orchestration编排控制多个服务或步骤按顺序协同工作。
Choreography协同自治各服务按事件自行响应,没有单一总控者。
Event-driven事件驱动由状态变化触发后续动作,适合异步流程与解耦。
Queue消息队列削峰填谷、异步处理、解耦服务的常见基础设施。
Circuit Breaker熔断下游挂了时主动断开,防止全链路雪崩。
Rate Limit限流限制调用频率,防止系统或三方接口被打穿。
Feature Flag特性开关不用重新发版也能控制功能开放范围,是灰度和回滚的基础。
Multitenancy多租户同一套系统服务多个客户,隔离、权限、配额是难点。
Observability可观测性通过日志、指标、链路追踪看清系统发生了什么。

05 质量 / 测试 / 稳定性

术语直白解释团队里真实含义
QA质量保障不是只测 bug,而是保证需求、实现、验收都可控。
Test Case测试用例把业务规则转成可验证条件,AI 场景里也会扩展成评测集。
Regression回归问题新改动把旧能力搞坏了。
Smoke Test冒烟测试先看主流程是不是活着,不追求全面。
Golden Set黄金样本集一组高质量代表性样本,常用于核心回归验证。
SLA
Service Level Agreement
服务等级承诺对外承诺可用性、响应时间、修复时效。
SLO
Service Level Objective
服务目标内部目标值,如 99.9% 可用性。
SLI
Service Level Indicator
服务指标用来衡量是否达成 SLO 的具体指标。
Error Budget错误预算允许系统在一定范围内不完美,用来平衡创新和稳定。
Canary金丝雀发布先给极小流量试运行,没炸再放大。
Gray Release灰度发布分人群、分流量逐步上线,便于观察和回退。
Rollback回滚出问题后快速恢复旧版本,不是补丁修修就算。
MTTR
Mean Time To Recovery
平均恢复时间系统出故障后恢复到正常所需平均时长。
成熟团队的真实差异,不在于“从不出问题”,而在于“发现问题多快、定位多准、恢复多快、复盘多狠”。

06 项目管理 / 协作

术语直白解释团队里真实含义
Roadmap路线图说明未来一段时间做什么,不是任务清单,而是方向和优先级表达。
Milestone里程碑关键阶段节点,常绑定可交付成果和决策点。
Scope范围项目到底做哪些、不做哪些;范围失控是常见死因。
Dependency依赖项你能不能推进,取决于谁先完成什么。
Blocker阻塞项不解决就没法继续推进的硬障碍。
Alignment对齐不是互相知道,而是目标、口径、优先级、责任边界一致。
Owner负责人不是参与者,而是对结果负责的人。
DOD
Definition of Done
完成定义做到什么程度才算完成,避免“我以为做完了”。
Acceptance Criteria验收标准需求交付时怎么判断达标。
Tech Debt技术债为了速度牺牲长期健康留下的后患。
Trade-off权衡取舍性能、成本、时效、稳定性、体验之间不能全要。
Escalation升级处理跨层级拉人解决问题,常意味着常规路径已经卡住。

07 业务化 / 产品化

术语直白解释团队里真实含义
Productization产品化把一个能力做成可售卖、可交付、可运维、可复制的产品。
Scale规模化不是用户多了而已,而是系统、组织、成本模型还能撑住。
PMF
Product-Market Fit
产品市场匹配产品真的打中了需求,不靠补贴和意志强推。
Activation激活用户第一次真正体验到价值的关键行为。
Retention留存用户会不会持续回来;AI 产品尤其容易首日惊艳、后续流失。
Funnel漏斗从触达到转化的分阶段流失路径。
North Star Metric北极星指标最能代表长期价值创造的核心指标。
Unit Economics单元经济模型每个客户、每次调用、每笔订单是不是赚钱。
Paywall付费墙免费和付费能力的边界设计,不只是“哪里收费”。
ROI投入产出比企业客户最关心:省了多少人、多少时间、多少钱。

08 最容易装懂的词

很多人嘴上怎么说真正应该问什么
平台化“做个平台统一起来”统一的是能力、流程、权限、数据,还是只是 UI 壳子?
智能化“接个模型就智能了”智能体现在哪个决策环节,成功率提升多少,成本增加多少?
闭环“我们已经形成闭环”输入、处理、输出、反馈、优化五段是否真的打通?
自动化“已经自动跑了”异常谁兜底,失败怎么恢复,人工介入点在哪里?
高可用“我们做了容灾”可用性指标是多少,切换策略是什么,故障演练做过没有?
可扩展“后面很好扩”扩的是场景、用户量、模型数、租户数,还是组织协作?
企业级“我们是企业级方案”权限、审计、配额、隔离、可观测、合规、SLA 哪些做了?
SOTA“我们用最先进方案”是 benchmark 上最强,还是你这个业务里综合性价比最优?
真正的研发沟通能力,不是会说黑话,而是能把黑话还原成:问题、约束、机制、指标、代价、边界。

极简记忆法

维度抓手例子
目标词它想解决什么问题MVP 解决“先验证价值,不先做完整”
机制词它靠什么机制起作用RAG 靠“检索 + 生成”起作用
约束词它的代价和边界是什么多租户提升复用,但增加隔离和配置复杂度
质量词如何判断它做好了Eval 看成功率、回归、成本、延迟
组织词它会改变谁的协作方式平台化会重塑研发、产品、运维边界