最近几年的AI大模型进化史_杨振互联网服务中心

近些年，AI的发展历程非常快，我从AI发展历程的视角来掌握这些术语。这不再是一个个孤立的工具，而是一部如何一步步“唤醒”大模型，使其成为能解决实际问题的“智能体”的进化史。这个过程可以分为三个核心阶段，如下图所示：

🔍 第一阶段：赋予“感知”与“记忆”

“

核心问题：大模型是个健忘的“天才”，它知识陈旧、记不住事。

为了让模型能处理你的私密文档和持续对话，你需要：

RAG：这是AI的“外部知识库”。通过将文档向量化后存入向量数据库，AI可以快速进行语义搜索，找到最相关的片段来回答问题。它解决了模型不知道你公司内部知识的问题。
向量数据库：这是RAG的专用“大脑皮层”，专门为存储和快速检索向量数据（如Milvus）而优化。
Memory：这是AI的“工作记忆”。它有三大管理策略：
- 截断：只保留最近的N轮对话。
- 总结：将长对话总结成要点。
- 检索：类似RAG，从历史中检索相关片段。它解决了模型记不住上周对话的问题。

🛠️ 第二阶段：赋予“行动”与“连接”

“

核心问题：大模型是个“纸上谈兵”的参谋，只能想，不能做。

为了让模型能真正操作你的电脑、访问网页、读写文件，你需要：

Tool：这是AI的“双手”。通过Tool（工具调用），模型可以执行代码、查询API、操作文件。比如Cursor写代码、Manus操作浏览器，都是通过调用Tool实现的。
Output Parser：这是确保AI“手眼协调”的关键。它将模型自由的自然语言输出，结构化成能精确调用Tool的指令（如JSON格式）。
MCP：你可以把它理解为Tool的“USB-C标准协议”。它让AI能以一种标准、安全的方式去发现和使用不同开发者提供的工具（如高德地图、浏览器操作），极大提升了工具的可复用性和集成效率。

🤖 第三阶段：组织成“智能体”

“

核心问题：有了手、脚、记忆和知识，如何让这个“超人”有效工作？

你需要一个“中枢神经系统”来统筹规划：

AI Agent：这就是上面所有能力的集合体。一个能使用工具、拥有记忆、并能基于RAG获取知识进行自主规划和执行的大模型，就是一个Agent。
LangChain：它是构建单个Agent的主流编排框架。它就像乐高手册，帮你把RAG、Memory、Tool、模型调用等模块，方便地连接成一个完整的工作流。
LangGraph：当任务复杂到需要多个Agent协作时（比如一个负责搜索，一个负责分析，一个负责写报告），就需要它。它基于LangChain，用图的形式来编排多个Agent的协作流程和状态流转。

🧠 名词解析

首先，提到的名词分为三类进行解读：

类别	名词	核心解释	类比（便于理解）
核心技术概念	RAG	检索增强生成：从外部知识库检索相关信息，并将其作为上下文提供给大模型，以生成更准确、实时、可靠的回答。解决模型“幻觉”和知识滞后问题。	像开卷考试：模型在作答前，先去翻阅指定的资料库。
	Memory	记忆：指AI系统（如智能体或聊天应用）保留和利用历史对话、事件或状态信息的能力，使其能进行连续的、有上下文的交互。	像聊天对象的记忆力，决定了对话是“一问一答”还是“深度交流”。
	Prompt工程	提示词工程：通过精心设计和优化输入给大模型的指令、问题或上下文，以引导其输出更符合预期的结果。这是与大模型交互的核心技能。	像给一位才华横溢但需要引导的助手下达清晰、具体的任务指令。
	Tool	工具：指大模型可以调用的外部功能，如计算器、搜索引擎、API、数据库等。赋予模型执行动作、获取实时信息的能力。	像给模型配备了“瑞士军刀”，让它不仅能说，还能做。
框架与协议	LangChain	一个用于开发由大模型驱动的应用程序的流行开源框架。它通过“链”的形式，将模型调用、提示词、工具、记忆等模块化组件连接起来。	像AI应用开发的“乐高积木箱”，提供了标准化的连接件和模块。
	LangGraph	基于LangChain的扩展库，用于构建具有复杂状态和循环的智能体。它使用“图”的概念来定义和控制智能体的工作流和决策路径。	像AI智能体的“流程图设计器”，可以处理多步骤、有分支和循环的任务。
	MCP	模型上下文协议：由Anthropic提出的一个新兴开源协议，旨在标准化AI应用与外部数据源、工具之间的安全、高效连接方式。	像AI世界里的“USB-C标准”，目标是让工具连接更统一、安全。

📚 AI应用开发核心名词术语表

除了你提到的，以下是你在学习、交流和面试中必然会遇到的其他关键名词：

一、大模型基础相关

名词	英文全称/缩写	简要解释
LLM	大语言模型	基于海量文本训练的、能理解和生成自然语言的深度学习模型。如GPT-4、Claude、LLaMA。
Token	词元	大模型处理文本的基本单元（可能是词、字或子词）。费用和长度限制通常按Token计算。
Completion	补全	指模型根据提示词生成后续文本的过程和结果。
Fine-tuning	微调	在预训练好的大模型基础上，用特定领域数据继续训练，使其适应专门任务。
幻觉	Hallucination	指大模型生成看似合理但事实上错误或编造的内容。这是RAG要解决的核心问题之一。

二、智能体与架构相关

名词	英文全称/缩写	简要解释
Agent	智能体	一个能理解目标、制定计划、调用工具来执行任务的大模型系统。是当前AI应用的高级形态。
ReAct	推理与行动	一种智能体框架范式：让模型循环进行Reason（推理）和Act（调用工具），直至完成任务。
CoT	思维链	一种Prompt技巧：要求模型在给出最终答案前，先输出一步步的推理过程，能显著提升复杂任务准确率。
Function Calling	函数调用	大模型根据用户请求，输出结构化参数以便调用预设函数（工具）的能力。是工具调用的主流实现方式。

三、工程与部署相关

名词	英文全称/缩写	简要解释
Embedding	向量嵌入	将文本、图像等数据转化为高维向量的技术，用于表示其语义。是RAG实现检索的基础。
Vector DB	向量数据库	专门用于存储和高效检索向量化数据的数据库，是RAG系统的核心组件。如Pinecone、Weaviate。
Streaming	流式输出	服务器将模型生成的结果分块实时传输给前端，实现逐字打印的效果，提升用户体验。
Orchestration	编排	指协调和管理多个AI组件（模型、工具、数据流）以完成复杂任务的过程。LangChain/LangGraph就是编排框架。

🔍 系统性地掌握这些概念？

例如：

RAG 在架构中连接了知识库，为LLM提供外部信息输入。
Tool 是智能体调用外部能力的桥梁。
LangChain/LangGraph 是整个编排框架层的具体实现。

阅读原文 >>

声明：来自程序员千羽，仅代表创作者观点。链接：https://eyangzhen.com/6168.html

最近几年的AI大模型进化史