AI领域那些云里雾里的热门词（AI热门词大辞典）到底是个啥，讲给普通人听
2026-03-21

我先讲一句实话：

“全部列出来”这件事，本身是没有绝对边界的，因为 AI 领域每天都在长新词。
但我下面这份，我会按“自生成式 AI 爆发以来，普通人最常听到、行业里最热、直播最值得讲”的标准，尽可能给你拉全，做成一张“大词典”。
你拿这份去做直播，已经足够覆盖绝大多数用户会碰到的热词、概念、工具和黑话。

我会按层级来讲，这样你后面也方便拆成 PPT。

一、最顶层：普通人必须先建立的总认知

这些词，是所有 AI 热词的“总开关”。不先懂这层，后面全乱。

1. AI

人工智能。
就是让机器表现出“像人在思考、判断、生成、执行”的能力。

2. 机器学习

不是程序员一条条写死规则，而是让机器从数据里“学规律”。

3. 深度学习

机器学习里最火的一支。
本质上是很多层神经网络去学复杂规律。

4. 大模型

参数很多、能力很强的模型。
现在大家口中的“大模型”，通常主要指大语言模型，也包括多模态模型。

5. 大语言模型，LLM

能理解和生成文字的大模型。
ChatGPT、Claude、Gemini、DeepSeek 这些，核心都属于这一类。OpenAI、Anthropic、Google 都在把它们做成更强的通用或推理能力平台。(OpenAI开发者)

6. 多模态

不只是懂文字，还能同时处理图片、音频、视频、代码等多种输入输出。Google 把 Gemini 3.1 Pro 描述为“原生多模态推理模型”，可以理解文本、音频、图像、视频和整个代码仓库。(Google DeepMind)

7. 生成式 AI

能“生成”新内容的 AI。
比如生成文字、图片、音乐、视频、代码、PPT。

8. AGI

通用人工智能。
行业里常被提及，指接近人类通用智能水平的 AI。
这个词很热，但今天还没有真正实现，更多是方向和愿景。OpenAI 首页仍把 AGI 作为长期目标来表述。(OpenAI)

9. AI Native

“原生 AI”思维。
不是在老业务上硬贴个 AI 功能，而是一开始就按“AI 是核心能力”来设计产品和流程。

10. Copilot

副驾驶。
意思不是全自动替代你，而是“在旁边帮你干活的 AI 助手”。GitHub Copilot 就是这个命名逻辑。(GitHub)

二、用户最常听到但最容易搞混的基础词

这一层，是直播里最容易帮用户“扫盲成功”的部分。

1. Token

这是近几年最热、最该讲透的词之一。

大白话解释：
Token 不是“一个字”，也不完全是“一个词”，而是模型处理文字时切分出来的最小单位。
OpenAI 官方说，文本生成和向量模型都是按 token 来处理文本；Google 也说明 Gemini 里 token 是模型处理输入输出的粒度，约等于若干字符。(OpenAI开发者)

它为什么重要？
因为很多东西都跟 token 绑定：
一是费用，很多 API 按 token 收费；
二是上下文长度，能塞多少内容进去取决于 token；
三是输出长度，回答太长也会吃 token；
四是性能，token 越多通常越慢、越贵。

2. Tokenizer

分词器。
就是把你输入的话切成 token 的工具。Hugging Face 官方就是这么定义的。(Hugging Face)

3. Context Window

上下文窗口。
你可以理解成 AI 的“短时工作记忆容量”。
OpenAI 的 GPT-4.1 页面写明可支持 1M token context window；Google 也在 Gemini 文档里专门解释长上下文和 1M 级窗口。(OpenAI开发者)

4. Prompt

提示词。
你对 AI 说的话，就是 prompt。
但今天它已经不只是“你问一句，它答一句”，而是整个交互指令体系。

5. System Prompt

系统提示词。
通常是开发者或平台预先给模型定的“角色、边界、规则”。

6. Completion / Response

模型生成出来的结果。
现在很多平台不一定还叫 completion，但本质就是“模型回复”。

7. Inference

推理。
行业里说“推理成本”“推理速度”，就是模型在真正运行、出结果时的过程，不是训练阶段。

8. Latency

延迟。
就是你发出请求到拿到结果花了多久。

9. Hallucination

幻觉。
AI 一本正经胡说八道。
这是 LLM 最经典的风险词之一。RAG 的流行，本质上就是为了减少这类问题。(LangChain 文档)

10. Temperature

温度。
控制回答更发散还是更稳。
温度高，容易更有创意；温度低，通常更稳定、更保守。

11. Top-p

另一种控制采样方式。
也是调“发散度”的。

12. Parameters

参数。
模型里学到的“内部权重”。
大家说“几百亿参数”“万亿参数”，就是在说模型规模。

13. Pretraining

预训练。
先在海量数据上学基础能力。

14. Post-training

后训练。
在预训练基础上继续调优，让模型更会听指令、更安全、更实用。

15. RLHF

基于人类反馈的强化学习。
曾经是大模型对齐的核心热词之一。
你直播里不用讲太深，说成“让模型更像人喜欢的回答方式”就行。

16. Distillation

蒸馏。
把大模型的能力“压缩传给”小模型。

17. Quantization

量化。
把模型权重压缩，降低显存占用，让本地部署更现实。Hugging Face 文档体系里把量化与优化作为重要方向之一。(Hugging Face)

18. Fine-tuning

微调。
在已有大模型基础上，用特定数据继续训练，让它更适应某个任务或领域。OpenAI 和 Hugging Face 都有官方微调文档。(OpenAI开发者)

19. Embedding

向量化表示。
把文字、图片等变成一串数字，方便做相似度搜索、聚类、检索。OpenAI 官方把 embeddings 定义为把文本转成数字，用于搜索、聚类等。(OpenAI开发者)

20. Benchmark

基准测试。
拿标准题集去测模型能力。

21. Evals

评测。
不是只看感觉，而是系统化衡量模型或应用到底好不好。

三、最近两年最火的一批“应用层大词”

这批词，在直播里最有话题性。

1. ChatGPT

全球最出圈的 AI 产品名之一。
它已经不只是聊天机器人，而是一个通用 AI 助手入口。OpenAI 官方把 ChatGPT定位为可写作、学习、头脑风暴、语音对话等的生产力工具。(OpenAI)

2. Claude

Anthropic 旗下主力 AI 产品。
在长文处理、表达、复杂任务、Agent 场景、编码协作里常被拿来和 ChatGPT 对比。Anthropic 官方把 Claude 的 agent 能力和 Claude Code 都单独强化出来了。(Anthropic)

3. Gemini

Google 的 AI 产品和模型体系。
近年一个突出标签就是“原生多模态”和超长上下文。Google 官方文档明确介绍了 1M 级长上下文能力。(Google AI for Developers)

4. DeepSeek

国产大模型里声量极高的名字之一。
普通人常把它理解为“国内很火、能聊天、能推理、能写代码的大模型”。
你直播里可以把它作为“中国用户讨论度极高的代表模型”。

5. Perplexity

“答案引擎”路线特别火的产品。
核心印象：不是只聊天，而是更偏“搜答案、找资料、给出处”。

6. GitHub Copilot

最知名的 AI 编程助手之一。GitHub 官方说它是“你的 AI pair programmer”，能在编辑器里给出整行甚至整个函数建议。(GitHub)

7. Midjourney

AI 绘图里最出圈的名字之一。
很多普通人一提 AI 画图，第一个想到就是它。

8. Stable Diffusion

开源图像生成路线里最经典的名字。
很多本地绘图、可控绘图生态都围着它展开。

9. Runway

AI 视频生成和视频编辑里很有代表性的名字。

10. Suno

AI 音乐生成里最热的名字之一。
普通人很容易被它震住，因为输入一句描述就能出歌。

11. ElevenLabs

AI 语音合成、克隆里高频被提到的工具。

四、2025 到 2026 特别热的一层：Agent 宇宙

这是你直播的重头戏之一。

1. Agent

智能体。
这不是一个具体软件，而是一类系统。
Anthropic 对 agent 的核心描述是：模型能够在更长时间里独立使用工具，完成复杂任务。(Anthropic)

大白话：
以前 AI 像“会答题的人”；
现在 Agent 更像“会自己拆步骤、会调用工具、会去执行的人”。

2. Workflow

工作流。
Anthropic 在“Building Effective AI Agents”里专门区分了 workflow 和 agent：workflow 更像预先编排好的固定流程，而更自主的 agent 则会自己决定如何推进。(Anthropic)

3. Agentic

带“智能体特征”的。
比如 agentic workflow，就是更偏自主决策、更会调用工具的流程。

4. Tool Use

工具调用。
模型不只是吐文字，而是会调用搜索、数据库、浏览器、代码执行器等工具。Anthropic 在 2025 年也专门讲了 advanced tool use。(Anthropic)

5. Tool Calling / Function Calling

函数调用。
大白话就是：模型不自己瞎编，而是去调用某个明确的外部能力。

6. Multi-Agent

多智能体。
不是一个 AI 干到底，而是多个 AI 分工合作。

7. Browser Use

浏览器使用。
Agent 直接操控浏览器做事。

8. Computer Use

电脑使用。
OpenAI 在 GPT-5.4 的介绍里明确强调了 native computer-use capabilities。(OpenAI)

9. Human in the Loop

人类在回路中。
关键节点仍然让人审核、决策、兜底。

10. Planning

规划。
Agent 先拆步骤，再执行。

11. Memory

记忆。
让智能体跨轮次保留信息，不至于每次都“失忆”。

12. Orchestration

编排。
把多个模型、工具、步骤、数据源组织起来协同工作。

五、现在超级热的一个词：MCP

这个词你下周一直播一定会被问到。

1. MCP

Model Context Protocol。
GitHub 文档把它定义为：一种协议，允许把 GitHub Copilot 跟其他系统集成，从而扩展能力。Anthropic 的工程文章也不断围绕 MCP 写工具、执行代码、扩展代理。(GitHub Docs)

大白话说：
MCP 就像“AI 和外部世界对接的标准插口”。

以前每接一个工具都要单独写。
现在大家想搞成统一标准。
这样 AI 可以更方便接知识库、数据库、文档、搜索、业务系统、IDE、浏览器等。

2. MCP Server

提供能力的一端。
比如提供搜索、数据库查询、代码仓库读取等能力。

3. MCP Client

使用这些能力的一端。
比如某个 Agent、IDE 插件、AI 助手。

4. MCP Registry

服务目录。
告诉你有哪些 MCP 服务可用。GitHub 现在也专门在 Copilot 体系里讲这个。(GitHub Docs)

你直播里一句话讲法：
“MCP，就是 AI 时代的通用插座标准。”

六、知识库与检索方向最热的词

这一层特别适合做“企业场景”解释。

1. RAG

Retrieval-Augmented Generation，检索增强生成。
LangChain 官方直接说，retrieval 是为了解决 LLM 的两大限制：上下文有限、知识冻结；RAG 就是在回答时先取外部知识再生成。(LangChain 文档)

大白话：
不是让 AI 靠脑补答，而是先翻资料，再回答。

2. Knowledge Base

知识库。
把企业文档、制度、FAQ、手册等喂给系统，让 AI 基于这些资料回答。

3. Chunking

切块。
把长文档切成小段，方便检索。

4. Retrieval

检索。
从知识库里把最相关的内容捞出来。

5. Reranking

重排序。
先粗找，再精排，让最相关内容排前面。

6. Semantic Search

语义搜索。
不是只看关键词，而是看语义相似度。

7. Vector

向量。
就是 embedding 后的数字表示。

8. Vector Database

向量数据库。Pinecone 官方把它定义为存储和索引向量嵌入、用于快速相似度搜索的数据库。(Pinecone)

9. Hybrid Search

混合搜索。
关键词匹配加语义搜索一起上。

10. Grounding

让回答“扎根于真实资料”。

七、编程圈最火的一批词和工具

这一层是技术圈的流量担当。

1. GitHub

程序员的代码协作平台。
存代码、做版本管理、多人协作、提 Issue、审代码。

2. Git

版本管理工具。
GitHub 是平台，Git 是底层机制。这个要分清。

3. Repository / Repo

代码仓库。
一个项目的家。

4. Commit

一次提交记录。

5. Branch

分支。
相当于你从主线拷出一条支线去改。

6. Pull Request，PR

把你的改动申请合并回主线。

7. Merge

合并代码。

8. Issue

问题单、任务单、缺陷单。

9. GitHub Copilot

AI 编程助手。可内联补全、聊天、智能编辑，还在往 agent 模式走。GitHub 和 VS Code 文档都在强调 agent 模式与多模型支持。(GitHub)

10. Agent Mode

GitHub 官方说明里已经明确：在 agent mode 下，Copilot 会自己判断改哪些文件、提出代码修改和终端命令，并迭代修复问题。(GitHub Docs)

11. Codex

OpenAI 官方最新定位已经不只是“代码模型”，而是 AI coding partner，并且强调“同一个 agent，到处都能编程”。OpenAI API 还把 gpt-5.2-codex 描述为针对 agentic coding tasks 优化。(OpenAI)

12. Claude Code

Anthropic 的编程型 agent 工具。
你可以把它讲成“Claude 在终端和代码仓库里的执行形态”。Anthropic 官方已把它作为独立产品能力对外介绍。(Anthropic)

13. Cursor

AI 代码编辑器里极热的名字。
普通人可理解成“为 AI 编程而生的编辑器”。

14. Windsurf

也是 AI IDE 赛道的热点名字。

15. VS Code AI / Copilot in VS Code

VS Code 正在把 AI 深度整合进去，官方文档已把 Copilot agents、模型选择、BYOK 等做成体系。(Visual Studio Code)

16. BYOK

Bring Your Own Key。
自己带模型 API Key 去接入某个平台。VS Code 文档就明确提到 BYOK。(Visual Studio Code)

17. Code Review

代码评审。
AI 也开始参与。

18. Refactor

重构。
不改业务功能，改代码结构。

19. Test Generation

自动生成测试代码。

20. Debug

查 bug。

八、做工作流、做机器人、做业务自动化时最常提到的工具

这块和普通人工作结合最紧。

1. Coze

Coze 官方把自己描述为“基于 AI Agent 的智能办公平台”，提供 AI 写作、PPT 生成、网页分析、会议纪要等生产力套件。(Coze)

大白话：
它更像一个“搭 AI 助手、搭 AI 应用、搭流程”的平台。

2. Dify

Dify 官方把自己定位为“agentic workflow builder”，可开发、部署、管理智能体和 RAG 流程；文档里也明确说它是开源平台，可视化定义流程、连接工具和数据源。(Dify)

3. n8n

自动化工作流工具里的热门名字。
很多人把它理解为“更工程化、更自由”的自动化平台。

4. Flowise

常被理解为低代码 LLM 编排和 Agent 构建工具。GitHub 生态资料也把它描述为面向开发者的开源低代码工具。(GitHub)

5. LangChain

大模型应用开发框架。
特别常见于 RAG、Agent、工具编排。

6. LangGraph

LangChain 体系里做更细粒度 agent / workflow 编排的东西。LangChain 官方文档直接说其 agent 实现基于 LangGraph。(LangChain 文档)

7. LangFlow

可视化工作流搭建工具。生态资料把它形容为类似 Dify、Flowise 的视觉化流程构建器。(GitHub)

8. OpenClaw

OpenClaw 官方 GitHub 主页把它定义为“运行在你自己设备上的个人 AI 助手”，能接入你已经在用的聊天渠道。(GitHub)

大白话：
它不是一个网页聊天机器人，而是“你自己掌控、自己部署、接入自己渠道的私人 AI 助手”。

9. Manus

Manus 官方把自己定位成“action engine”，强调“超越回答，去执行任务、自动化工作流、扩展人的行动半径”。(Manus)

大白话：
它卖点不是“会说”，而是“会替你做”。

九、本地部署与开源模型圈最火的词

这块很容易让用户感觉“高深”，但你直播里讲明白就会很加分。

1. Open Source

开源。
代码公开，大家可以看、改、用。

2. Open Weight

开放权重。
不一定所有训练过程都开源，但模型权重可下载使用。

3. Self-hosted

自托管。
自己部署在自己电脑或服务器。

4. Local LLM

本地大模型。
不走云端，直接在本机或内网跑。

5. Ollama

本地跑大模型最出圈的名字之一。官方提供下载、模型库、Docker 等能力；其博客也强调本地运行与隐私。(Ollama)

6. llama.cpp

极其经典的本地推理工具链。

7. vLLM

高性能模型推理服务框架。
技术圈讨论度很高。

8. Open WebUI

本地模型常搭配的网页界面。

9. Llama

Meta 模型家族名，也是开源圈最响亮的名字之一。

10. Qwen

阿里通义模型家族，国内外讨论度都高。

11. Mistral

欧洲很有代表性的模型公司和模型名。

12. Gemma

Google 的开放模型家族。

13. DeepSeek-R1 / Coder

国产模型圈里经常被讨论的系列名。

14. GGUF

本地部署圈常见模型文件格式。

15. GPU / VRAM / 显存

本地跑模型时最关键的硬件门槛。

十、图片生成赛道最热门的一串词

1. Midjourney

AI 绘图第一梯队的代表名。

2. Stable Diffusion

开源绘图生态的核心基石之一。

3. Flux

近年图像生成圈讨论很多的名字。

4. SDXL

Stable Diffusion XL，常见的大图模型名。

5. LoRA

低成本定制风格或人物能力的热门方法。
绘图圈、视频圈、语音圈都能听到。

6. Checkpoint

模型权重包。
画图圈高频词。

7. Prompt

画图提示词。
和文本模型的 prompt 类似，但更偏画面描述。

8. Negative Prompt

负面提示词。
告诉模型“不要出现什么”。

9. Seed

随机种子。
控制结果可复现。

10. ControlNet

可控生成热词。
比如你给姿势、轮廓、线稿，让图更听话。

11. Inpainting

局部重绘。

12. Outpainting

外扩补图。

13. Upscale

放大增强。

14. ComfyUI

ComfyUI 官方 GitHub 写得很明确：它是用图形节点界面来设计和执行高级 Stable Diffusion 流程的。(GitHub)

大白话：
就是“用搭积木方式来拼 AI 绘图工作流”。

15. A1111

Automatic1111，老牌 Stable Diffusion WebUI 名字。

十一、视频生成赛道的高频词

1. Text to Video

文生视频。

2. Image to Video

图生视频。

3. Video to Video

视频转视频。

4. Runway

AI 视频生成和视频编辑里极有代表性。

5. Pika

视频生成圈很高频的名字。

6. Kling

中文互联网里经常被提到的视频模型名。

7. Sora

OpenAI 视频生成方向的代表名之一。

8. Keyframe

关键帧。

9. Motion Brush

局部运动控制。

10. Camera Control

镜头控制。

十二、音频、语音、音乐赛道高频词

1. TTS

Text to Speech，文本转语音。

2. ASR

Automatic Speech Recognition，语音转文字。

3. Voice Clone

声音克隆。

4. Speaker Diarization

说话人分离。
会议纪要里常见。

5. ElevenLabs

语音合成赛道高频工具名。

6. Suno

AI 音乐生成高频工具名。

7. Udio

AI 音乐圈另一个常见名字。

8. Music Gen

文生音乐方向的总称。

9. Lip Sync

口型同步。

十三、普通人工作里最容易碰到的商业化词

1. API

应用程序接口。
大白话：让两个系统能对接的“通道”。

2. SDK

开发工具包。
比 API 更方便，已经有人帮你封装好一部分。

3. Endpoint

接口地址。

4. Rate Limit

速率限制。
请求太多会被限流。

5. Billing

计费。

6. Input Tokens / Output Tokens

输入 token、输出 token。
大多数平台按这个算成本。

7. Throughput

吞吐量。
单位时间能处理多少请求。

8. SLA

服务承诺等级。

9. Guardrails

护栏。
限制 AI 不乱来。

10. Safety / Alignment

安全与对齐。
让模型更符合人类规则和平台要求。

11. Privacy

隐私。

12. Compliance

合规。

13. Enterprise

企业版。

14. On-prem

私有化、本地化部署。

15. BYOD / BYOM / BYOK

自己带设备、自己带模型、自己带 key。
今天技术产品里经常出现变种。

十四、模型能力圈特别爱炒的词

1. Reasoning Model

推理模型。
更强调多步思考、复杂问题处理。

2. Non-reasoning Model

非推理模型。
OpenAI 的 GPT-4.1 页面就把自己写成“smartest non-reasoning model”一类。(OpenAI开发者)

3. Tool-using Model

会调用工具的模型。

4. Long-context Model

长上下文模型。
Gemini 3 系列在这方面的官方叙述非常明显。(Google AI for Developers)

5. Multimodal Reasoning

多模态推理。

6. Coding Model

代码模型。
比如 Codex 类能力。

7. Vision Model

视觉模型。

8. Speech Model

语音模型。

9. Realtime Model

实时语音、实时交互模型。OpenAI API 更新里也持续有 realtime 相关能力。(OpenAI开发者)

10. Computer-use Model

能操控电脑的模型。OpenAI 已把 computer use 作为新一代重要能力之一。(OpenAI)

十五、用户最容易被唬住的“伪高级词”

这批词直播里特别适合拆穿。

1. AI 自动化

很多时候说得很玄，其实本质就是：
规则流程 + 模型能力 + 工具调用。

2. 超级个体

内容创业圈很爱说。
本质是：借 AI 提升一个人的产能和能力上限。

3. 第二大脑

知识管理和效率圈高频词。
本质是：把信息收集、整理、回忆、调用交给系统辅助。

4. 数字员工

很多时候就是企业版 agent 或流程机器人。

5. AI 员工

营销词居多。
真相通常是：某个场景下的自动化 AI 工作流。

6. 全自动 Agent

最容易被过度宣传。
现实里多数仍需要人设边界、给权限、做审核。

十六、你直播里最值得重点讲的“工具名单”

如果从“普通人听过或者行业特别热”角度，下面这一串建议你重点记住：

第一组：全民认知级

ChatGPT
Claude
Gemini
DeepSeek
Midjourney
GitHub Copilot
Perplexity

第二组：Agent 和工作流热词级

Agent
Workflow
MCP
Coze
Dify
n8n
Flowise
LangChain
LangGraph
Manus
OpenClaw

第三组：编程和开发热词级

GitHub
Git
Repo
PR
Codex
Claude Code
Cursor
Windsurf
VS Code AI
BYOK

第四组：知识库和企业应用热词级

RAG
Embedding
Vector Database
Chunking
Semantic Search
Knowledge Base
Fine-tuning
Evaluation

第五组：本地部署和开源热词级

Ollama
Llama
Qwen
Mistral
Gemma
vLLM
Open WebUI
Quantization
GGUF

第六组：图像视频音频热词级

Stable Diffusion
ComfyUI
LoRA
ControlNet
Runway
Pika
Sora
Suno
ElevenLabs
TTS
ASR

十七、如果你做直播，我建议你把这些词分成三档来讲

A档：普通人必须懂

AI
大模型
LLM
多模态
Token
Prompt
上下文
幻觉
RAG
Agent
MCP
ChatGPT
Claude
Gemini
DeepSeek
GitHub
GitHub Copilot
Coze
Dify
Manus
OpenClaw
Ollama

B档：懂了就很有社交货币

Embedding
向量数据库
Fine-tuning
Function Calling
Tool Use
Workflow
LangChain
LangGraph
Codex
Claude Code
Cursor
ComfyUI
LoRA
ControlNet
BYOK

C档：行业内很热，但普通人可以先知道名字

vLLM
GGUF
MoE
蒸馏
量化
Reranking
Grounding
Benchmark
Evals
Realtime
Computer Use
Open Weight

十八、你可以在直播里直接用的一句话总结

你可以这样讲：

“AI 这两年最热的词，看起来很多，其实就三层。
第一层，模型本身，比如大模型、Token、上下文、推理、多模态。
第二层，能力怎么落地，比如 RAG、Agent、MCP、工作流、工具调用。
第三层，产品和工具，比如 ChatGPT、Claude、Gemini、Coze、Manus、Codex、Claude Code、GitHub、OpenClaw、Ollama。
你一旦把这三层理清，AI 世界就不再乱了。”

再给你一句更适合海报或者开场的话：

“今天 AI 圈 80% 的黑话，其实都能归到：模型、连接、执行，这三件事。”

AI领域那些云里雾里的热门词（AI热门词大辞典）到底是个啥，讲给普通人听 2026-03-21