Agent Skill 是什么?
當(dāng)前位置:點(diǎn)晴教程→知識(shí)管理交流
→『 技術(shù)文檔交流 』
做 Agent 開發(fā)一段時(shí)間后,大部分人都會(huì)遇到同一個(gè)問題: Prompt 越寫越長(zhǎng),模型執(zhí)行越來越飄。 你把所有規(guī)范、流程、示例一股腦塞進(jìn)系統(tǒng) Prompt,token 蹭蹭漲,模型的注意力卻被稀釋了——它在"同時(shí)看著"幾十件事,結(jié)果每件事都做得不夠準(zhǔn)。 Agent Skill 就是在解決這個(gè)問題。 核心思路:按需加載把不同能力拆成獨(dú)立的"技能包",Agent 根據(jù)當(dāng)前任務(wù),只加載需要的那一個(gè)。 就像你電腦裝了幾十個(gè)軟件,但你只打開當(dāng)前要用的那個(gè),其他的不占內(nèi)存。 Context Window 就是 Agent 的"內(nèi)存",留給當(dāng)前任務(wù)的空間越干凈,執(zhí)行越穩(wěn)定。 一個(gè) Skill 的三層結(jié)構(gòu)第一層:Metadata(元信息)技能的"身份證"——叫什么、能干什么、什么時(shí)候觸發(fā)。 Metadata 很輕,系統(tǒng)可以把所有技能的 Metadata 一起加載,讓 Agent 先選用哪個(gè)技能,而不需要把完整內(nèi)容全暴露出來。 第二層:Instruction(執(zhí)行指令)真正告訴 Agent "這件事怎么做",只在執(zhí)行這個(gè)技能時(shí)才加載進(jìn)上下文。 第三層:Resources(外部資源)有些技能執(zhí)行時(shí)還需要額外的東西:規(guī)則庫(kù)、模板、腳本、外部工具調(diào)用等。這些放在 Resources 層,Agent 按需拉取,用完即走。 三層各司其職
這就是所謂的漸進(jìn)式披露——信息隨執(zhí)行進(jìn)度逐步展開,而不是一開始全部堆在上下文里。 設(shè)計(jì) Skill 時(shí)最容易踩的坑粒度問題。 一個(gè)技能對(duì)應(yīng)一個(gè)完整的用戶意圖,不要太粗也不要太細(xì)。
描述要精準(zhǔn)。 Agent 靠 Metadata 的 description 來判斷用不用這個(gè)技能,描述模糊就容易選錯(cuò)。 舉例比如我們現(xiàn)在需要生成一個(gè)視頻,但是并不知道怎么做,這時(shí)候可以借助這個(gè)skill,skills.sh/vercel-labs…,我們把這個(gè) skill 安裝到本地
然后直接向 ai 提問,ai 會(huì)自動(dòng)尋找這個(gè) skill,并利用這個(gè)skill生成視頻 |
相關(guān)文章
正在查詢... |