自主運行 ChatGPT
AgentGPT: https://agentgpt.reworkd.ai/
李宏毅老师推荐先使用 Godmode,理由是: 这个模型在每一个执行阶段,都会停下来询问是否要执行,而且会很楚地表示为什么要这样做,甚至可以用 feedback 去矫正模型。很适合用于入门了解这类自主运行模型。
把大任務拆解成一連串的小任務,也就是讓機器「做計畫」
Recursive Reprompting and Revision (Re3)
https://arxiv.org/abs/2210.06774
Language Models as Zero-Shot Planners 用语言模型与虚拟环境互动
挑戰一:如何自動根據大任務規劃一系列子任務
In Context Learning
挑戰二:如何把子任務對應到可執行的動作
执行最像的动作
Hugging GPT (Jarvis)
给该模型一个复杂任务
做规划如何解这个任务
从 HuggingFace 中找模型来解子任务
MiniWoB++ (Mini World of Bits++)
上述例子是让模型去操控一连串其它的 AI 模型。而这个是能够看荧幕,去跟荧幕里面的物件做互动。
输入:网页html 输出:(怎么做到打字、移动鼠标?)用一个很长的prompt让模型输出特定格式来对应相关动作
特殊之处:除了做计划外,还有自我反省改进计划