大模型不是只会聊天 —— Skill插件到底能做些什么？

大模型的技术中可能经常听到”Skill”，它是做什么用的？能帮助我们做什么？我们怎么才能用到这个技能？

其实，大模型中的”Skill”≈一个”能完成特定任务的小程序”。

想象一下：大模型本身就像一个巨大的操作系统（例如Windows）。操作系统本身很强大，但你要让它帮你“将今天的气温超过30度的城市列出来并且排序”，直接问它，它可能说胡话。

这怎么整？给这个大操作系统装上一个个”小插件”或者”专用工具”。这些”小插件”就叫做Skill（技能）。

大模型相关历史文章，

《能大米刻字的ChatGPT Images 2.0》

《RAG通俗易懂的理解》

《”多模态”通俗易懂的理解》

《大模型”幻觉”通俗一些的理解》

《Token通俗一些的理解》

《小白都可以看懂的小龙虾安装教程》

《OpenClaw：你养的是虾还是被时代落下的恐惧？》

举个例子
普通大模型：你问“帮我发一封邮件给老王，说今晚吃饭”。
它可能只知道生成邮件内容，但没法真的发出去。

装了“发邮件Skill”的大模型：这个Skill就像一个小模块，知道怎么调用你的邮箱API、填收件人、点发送。
大模型会说：“好的，我调用‘发邮件技能’帮你发送了。”

为什么大模型需要这种Skill？
因为大模型本质上是一个文本预测器（猜下一个词），它没有手，不能直接操作外部系统——不能真发邮件、不能查数据库、不能打开计算器、不能控制机器人。

所以研究人员给它造了很多Skill，让它可以做这些，

图片
大模型的工作流程变成：
用户提问 → 大模型判断要用哪个Skill → 调用那个Skill得到结果 → 整理答案返回。

一个经典例子：Toolformer / ChatGPT插件
Toolformer（Meta 2023年论文）就是让大模型自己学会调用工具（计算器、翻译器等）。这些工具就是Skill。

ChatGPT的插件（Plugin）本质上也是一种Skill。你装一个“订机票插件”，ChatGPT就能帮你订票。

一句话区分
普通说的“大模型的能力”：像写诗、翻译、总结，是模型自己学到的。

大模型技术里说的“Skill”：是专门为模型设计的、可调用的外部工具或子程序，让模型能做它原本做不到的事（例如操作外部系统、精确计算、控制设备）。

所以当你下次看到大模型论文说”我们给模型增加了20个Skills”，你可以理解为：”我们给模型装了20个小插件，让它能真正操控现实世界的一些东西了。”

声明：来自bisal的个人杂货铺，仅代表创作者观点。链接：https://eyangzhen.com/8096.html