最近几年的AI大模型进化史

近些年,AI的发展历程非常快,我从AI发展历程的视角来掌握这些术语。这不再是一个个孤立的工具,而是一部如何一步步“唤醒”大模型,使其成为能解决实际问题的“智能体”的进化史。这个过程可以分为三个核心阶段,如下图所示:

🔍 第一阶段:赋予“感知”与“记忆”

核心问题:大模型是个健忘的“天才”,它知识陈旧、记不住事。

为了让模型能处理你的私密文档和持续对话,你需要:

  1. RAG:这是AI的“外部知识库”。通过将文档向量化后存入向量数据库,AI可以快速进行语义搜索,找到最相关的片段来回答问题。它解决了模型不知道你公司内部知识的问题。
  2. 向量数据库:这是RAG的专用“大脑皮层”,专门为存储和快速检索向量数据(如Milvus)而优化。
  3. Memory:这是AI的“工作记忆”。它有三大管理策略:
    • 截断:只保留最近的N轮对话。
    • 总结:将长对话总结成要点。
    • 检索:类似RAG,从历史中检索相关片段。它解决了模型记不住上周对话的问题。

🛠️ 第二阶段:赋予“行动”与“连接”

核心问题:大模型是个“纸上谈兵”的参谋,只能想,不能做。

为了让模型能真正操作你的电脑、访问网页、读写文件,你需要:

  1. Tool:这是AI的“双手”。通过Tool(工具调用),模型可以执行代码、查询API、操作文件。比如Cursor写代码、Manus操作浏览器,都是通过调用Tool实现的。
  2. Output Parser:这是确保AI“手眼协调”的关键。它将模型自由的自然语言输出,结构化成能精确调用Tool的指令(如JSON格式)。
  3. MCP:你可以把它理解为Tool的“USB-C标准协议”。它让AI能以一种标准、安全的方式去发现和使用不同开发者提供的工具(如高德地图、浏览器操作),极大提升了工具的可复用性和集成效率。

🤖 第三阶段:组织成“智能体”

核心问题:有了手、脚、记忆和知识,如何让这个“超人”有效工作?

你需要一个“中枢神经系统”来统筹规划:

  1. AI Agent:这就是上面所有能力的集合体。一个能使用工具拥有记忆、并能基于RAG获取知识进行自主规划和执行的大模型,就是一个Agent。
  2. LangChain:它是构建单个Agent的主流编排框架。它就像乐高手册,帮你把RAG、Memory、Tool、模型调用等模块,方便地连接成一个完整的工作流。
  3. LangGraph:当任务复杂到需要多个Agent协作时(比如一个负责搜索,一个负责分析,一个负责写报告),就需要它。它基于LangChain,用的形式来编排多个Agent的协作流程和状态流转。

🧠 名词解析

首先,提到的名词分为三类进行解读:

类别名词核心解释类比(便于理解)
核心技术概念RAG检索增强生成:从外部知识库检索相关信息,并将其作为上下文提供给大模型,以生成更准确、实时、可靠的回答。解决模型“幻觉”和知识滞后问题。像开卷考试:模型在作答前,先去翻阅指定的资料库。
Memory记忆:指AI系统(如智能体或聊天应用)保留和利用历史对话、事件或状态信息的能力,使其能进行连续的、有上下文的交互。像聊天对象的记忆力,决定了对话是“一问一答”还是“深度交流”。
Prompt工程提示词工程:通过精心设计和优化输入给大模型的指令、问题或上下文,以引导其输出更符合预期的结果。这是与大模型交互的核心技能。像给一位才华横溢但需要引导的助手下达清晰、具体的任务指令。
Tool工具:指大模型可以调用的外部功能,如计算器、搜索引擎、API、数据库等。赋予模型执行动作、获取实时信息的能力。像给模型配备了“瑞士军刀”,让它不仅能说,还能做。
框架与协议LangChain一个用于开发由大模型驱动的应用程序的流行开源框架。它通过“链”的形式,将模型调用、提示词、工具、记忆等模块化组件连接起来。像AI应用开发的“乐高积木箱”,提供了标准化的连接件和模块。
LangGraph基于LangChain的扩展库,用于构建具有复杂状态和循环的智能体。它使用“图”的概念来定义和控制智能体的工作流和决策路径。像AI智能体的“流程图设计器”,可以处理多步骤、有分支和循环的任务。
MCP模型上下文协议:由Anthropic提出的一个新兴开源协议,旨在标准化AI应用与外部数据源、工具之间的安全、高效连接方式。像AI世界里的“USB-C标准”,目标是让工具连接更统一、安全。

📚 AI应用开发核心名词术语表

除了你提到的,以下是你在学习、交流和面试中必然会遇到的其他关键名词:

一、大模型基础相关

名词英文全称/缩写简要解释
LLM大语言模型基于海量文本训练的、能理解和生成自然语言的深度学习模型。如GPT-4、Claude、LLaMA。
Token词元大模型处理文本的基本单元(可能是词、字或子词)。费用和长度限制通常按Token计算。
Completion补全指模型根据提示词生成后续文本的过程和结果。
Fine-tuning微调在预训练好的大模型基础上,用特定领域数据继续训练,使其适应专门任务。
幻觉Hallucination指大模型生成看似合理但事实上错误或编造的内容。这是RAG要解决的核心问题之一。

二、智能体与架构相关

名词英文全称/缩写简要解释
Agent智能体一个能理解目标、制定计划、调用工具来执行任务的大模型系统。是当前AI应用的高级形态。
ReAct推理与行动一种智能体框架范式:让模型循环进行Reason(推理)和Act(调用工具),直至完成任务。
CoT思维链一种Prompt技巧:要求模型在给出最终答案前,先输出一步步的推理过程,能显著提升复杂任务准确率。
Function Calling函数调用大模型根据用户请求,输出结构化参数以便调用预设函数(工具)的能力。是工具调用的主流实现方式。

三、工程与部署相关

名词英文全称/缩写简要解释
Embedding向量嵌入将文本、图像等数据转化为高维向量的技术,用于表示其语义。是RAG实现检索的基础。
Vector DB向量数据库专门用于存储和高效检索向量化数据的数据库,是RAG系统的核心组件。如Pinecone、Weaviate。
Streaming流式输出服务器将模型生成的结果分块实时传输给前端,实现逐字打印的效果,提升用户体验。
Orchestration编排指协调和管理多个AI组件(模型、工具、数据流)以完成复杂任务的过程。LangChain/LangGraph就是编排框架。

🔍 系统性地掌握这些概念?

例如:

  • RAG 在架构中连接了知识库,为LLM提供外部信息输入。
  • Tool 是智能体调用外部能力的桥梁。
  • LangChain/LangGraph 是整个编排框架层的具体实现。

声明:来自程序员千羽,仅代表创作者观点。链接:https://eyangzhen.com/6168.html

程序员千羽的头像程序员千羽

相关推荐

添加微信
添加微信
Ai学习群
返回顶部