大模型的技术中可能经常听到”Skill”,它是做什么用的?能帮助我们做什么?我们怎么才能用到这个技能?
其实,大模型中的”Skill”≈一个”能完成特定任务的小程序”。
想象一下:大模型本身就像一个巨大的操作系统(例如Windows)。操作系统本身很强大,但你要让它帮你“将今天的气温超过30度的城市列出来并且排序”,直接问它,它可能说胡话。
这怎么整?给这个大操作系统装上一个个”小插件”或者”专用工具”。这些”小插件”就叫做Skill(技能)。
大模型相关历史文章,
《能大米刻字的ChatGPT Images 2.0》
《RAG通俗易懂的理解》
《”多模态”通俗易懂的理解》
《大模型”幻觉”通俗一些的理解》
《Token通俗一些的理解》
《小白都可以看懂的小龙虾安装教程》
《OpenClaw:你养的是虾还是被时代落下的恐惧?》
举个例子
普通大模型:你问“帮我发一封邮件给老王,说今晚吃饭”。
它可能只知道生成邮件内容,但没法真的发出去。
装了“发邮件Skill”的大模型:这个Skill就像一个小模块,知道怎么调用你的邮箱API、填收件人、点发送。
大模型会说:“好的,我调用‘发邮件技能’帮你发送了。”
为什么大模型需要这种Skill?
因为大模型本质上是一个文本预测器(猜下一个词),它没有手,不能直接操作外部系统——不能真发邮件、不能查数据库、不能打开计算器、不能控制机器人。
所以研究人员给它造了很多Skill,让它可以做这些,
图片
大模型的工作流程变成:
用户提问 → 大模型判断要用哪个Skill → 调用那个Skill得到结果 → 整理答案返回。
一个经典例子:Toolformer / ChatGPT插件
Toolformer(Meta 2023年论文)就是让大模型自己学会调用工具(计算器、翻译器等)。这些工具就是Skill。
ChatGPT的插件(Plugin)本质上也是一种Skill。你装一个“订机票插件”,ChatGPT就能帮你订票。
一句话区分
普通说的“大模型的能力”:像写诗、翻译、总结,是模型自己学到的。
大模型技术里说的“Skill”:是专门为模型设计的、可调用的外部工具或子程序,让模型能做它原本做不到的事(例如操作外部系统、精确计算、控制设备)。
所以当你下次看到大模型论文说”我们给模型增加了20个Skills”,你可以理解为:”我们给模型装了20个小插件,让它能真正操控现实世界的一些东西了。”
声明:来自bisal的个人杂货铺,仅代表创作者观点。链接:https://eyangzhen.com/8096.html