无尘阁日记

无尘阁日记

039AI系统技术栈三层结构图
2025-06-17

这张图是一个典型的AI系统技术栈三层结构图,展示了从底层数据到顶层应用,整个大模型系统是如何架构、协作和部署的。我们可以将其拆解为三层,分别为:

一、基础数据层:原材料层

这是整个系统的“地基”,也是支撑模型认知、推理、生成的“语料矿”。其中包含:

✅ 医学指南、文章内容等:

结构化或半结构化的专业文本语料,是领域知识的“标准答案”,例如《梅奥诊疗手册》《中华医学会指南》。

✅ 会话数据、用户信息、用药信息:

对话数据帮助模型理解“人说话的方式”;而用户信息和用药信息用于个性化推荐和问答。

✅ 数据清洗、标注:

这是数据工程最关键环节之一,原始数据往往存在错误、不规范、冗余等问题,必须经过清洗、去噪、分词、标注等步骤,才可用于训练或嵌入。

🔍 图示含义:
这一层用绿色标识,说明是“已部署/可用”状态。这些是现实可采集、可加工的数据资产,构建好之后便可向上传递价值。

二、AI基础模型层:推理大脑层

这一层是整个AI系统的“核心处理器”。它不产生知识,而是加工已有知识,提取模式,生成语言。主要构成包括:

🟥 大语言模型(LLM):

这是整张图中唯一用红色标记的模块,说明它是整个系统里最重要、最中心、也是难以完全替代或掌控的黑盒组件。比如 GPT-4、Claude、文心一言等。

⚪ 模型微调、蒸馏、压缩、强化学习:

这些是为了让大模型更好适配特定任务或落地应用所做的“本地调教”。它们虽然技术性强,但不改变模型底层结构,只是“训出你想要的性格和行为”。

🔍 图示含义:
这层中的大语言模型是“高投入、高风险、高回报”的核心;而微调等则是围绕它构建“适应层”的常见手段。

三、AI应用层:智能体表现层

这层是用户可交互可感知的产品接口,也是整个技术栈最贴近实际业务落地的地方。关键组件包括:

✅ 智能体(Agent):

用自然语言完成多步骤任务,调度工具、执行逻辑、调用内存,逐步成为应用的核心形式。

✅ 向量库:

用于 RAG 检索问答系统,把长文档“嵌入”为向量,实现“文档类知识随用随查”。

✅ 工具(Tool):

Agent 的外部动作能力,如:调用搜索、表格分析、天气查询等。

✅ RAG、ReRank 排序:

这些是结合上下文增强模型记忆力、判断力的系统组件。RAG是知识接入,ReRank是排序优化。

🟥 提示词工程(Prompt Engineering):

虽然在这层仍然重要,但此处标红,意味着它是目前最大的瓶颈和不确定性。因为纯靠 prompt 很难构建稳健系统,一旦输入略变就可能崩盘。

🔍 图示含义:
此层以绿色为主,表明绝大部分已可落地;但提示词工程仍需大量人工调试,难以标准化,阻碍规模化复制。

四、图整体结构解读

从下至上:

  • 数据是根:没有数据,模型是空架子;

  • 模型是核:没有强大的 LLM,整个系统无法智能;

  • 应用是果:只有将模型转化为 Agent、RAG 等能力,才会产生真正的用户价值。

从左至右:

  • 从知识→能力→产品的演化轨迹

  • 每一层都承接下一层的可能性;

  • 绿色代表可用,红色代表挑战,灰色代表调优。

五、为何“提示词工程”和“大语言模型”是红色

  1. 提示词工程红色

    • 因为它依赖人的经验调参;

    • 不具备稳定性、标准性、可迁移性;

    • 一旦应用场景改变,就得重写或调整 Prompt;

    • 属于“非结构化调试”,难自动化。

  2. 大语言模型红色

    • 因为训练成本极高(时间、算力、资金);

    • 对安全性、幻觉、准确率等难控制;

    • 本身仍是“闭源黑盒”,用户只能围绕它“打补丁”;

    • 是整个技术堆栈中最核心也最不可控的部分。

六、未来优化方向

  1. 让 Prompt 工程转向 Workflow 架构,由 Prompt 转向动态流程结构(如 CrewAI、LangGraph);

  2. Agent 化持续推进,让 LLM 成为“内核”,工具和任务逻辑可自由堆叠;

  3. 数据驱动更智能的微调,通过语义反馈/强化学习等机制改善 LLM 行为;

  4. RAG + 多模态融合,让模型理解文图表并跨模态推理;

  5. Agent 和系统打通接口,与 ERP/CRM 等业务系统深度融合,走向真正 AI 工具人。

总结

这张图不是简单的三层架构图,而是一份AI系统的落地路线图与挑战地图

  • 最上层是“你看到的界面”;

  • 中间层是“你看不到的大脑”;

  • 底层是“你忘记的数据基础”。

它提醒我们:

真正的 AI 系统不是“调个模型就能用”,而是一个从数据采集到知识注入、模型调用、任务执行的全流程系统工程。

如夜话,至此。