一张图讲清楚AI大模型技术实现逻辑

最近很多公司宣布接入了DeepSeek，让体验DeepSeek时饱受“服务器超时”的同学有了新的使用入口。

问题来了，为什么这么多公司都在宣布接入DeepSeek？DeepSeek的优势到底是什么？今天一张图讲清楚。

提前声明：本文内容为个人理解和思考总结，仅供参考。

下图为用户发起提问到AI大模型工具给出结果，大体的请求处理逻辑。

基本名词和术语解析：

RAG：(Retrieval-Augmented Generation)是一种结合信息检索（IR）与生成式人工智能（如大型语言模型LLM）的技术。其核心思想是通过检索外部知识库中的信息来增强生成内容的准确性和相关性。

Prompt：简单来说就是提示词。

Embedding：是一种将高维稀疏数据映射到低维稠密向量空间的技术，广泛应用于自然语言处理（NLP）、推荐系统、图像处理、计算机视觉等领域。其核心思想是通过将对象（如词语、句子、用户、物品等）映射为低维向量，捕捉对象之间的潜在语义关系和相似性，从而实现降维、特征提取和建模目标。

FunctionCalling：FunctionCalling 是一种自然语言理解能力的技术，开发者可以定义一组函数，并将这些函数的描述传递给模型。当用户通过自然语言提出指令时，模型会解析这些指令并调用相应的函数。

其中，EMB的作用简单来说就是对已有数据进行维度拆分，以便于模型更好的调用。

模型指的是各公司自有的训练大模型，训练所用的数据需要经过治理(获取原始数据-清洗-标注)。

而RAG的作用则是查找合适的数据，让模型去甄别哪些更有效，主要解决AI推理结果的知识滞后和相对幻觉问题。

而DeepSeek如此火爆的原因在于，其RAG能力在实现相同结果时所耗费的成本很低，即可以在相同的计算复杂度(简单理解就是Tokens消耗更低)前提下，使用更少的资源输出同等甚至略有提升的结果。

这也是为什么DeepSeek R1功能如此受推崇的原因之一。

当然，DeepSeek火爆的原因还有其他方面，比如更低的成本，比如初步具备的AGI能力(语言理解、抽象思考和深度逻辑推理)。

新建了一个AI知识星球，限时免费体验！

扫描下方二维码加我好友，围观朋友圈，我会分享关于AI和自由职业的思考。

声明：文中观点不代表本站立场。本文传送门：https://eyangzhen.com/425178.html