AIAgent李宏毅免責聲明:AIAgent是一個被廣泛使用的詞彙,故本課程中所講的AIAgent不一定跟其他地方一樣今天使用AIAIAgent的翻譯的方式「人工智慧代理人」人類給予明確指令(解決某個研究問題)AI一個口令假設…實驗…分析一個動作需要多步驟、靈活調整計畫AIAgent人類給予目標AI自己想辦法達成AIAgentObservationActionGoalAIAgent(AlphaGo)ObservationGoal贏棋“5-5”Action好像在那裡聽過這個段落?這是ReinforcementLearning(RL)常見開場(RL:ReinforcementLearning)如何打造AIAgent?RL?ObservationGoal贏棋RewardRL:Learnto“5-5”MaximizeRewardAction侷限:需要為了每一個任務以RL訓練模型如何打造AIAgent?直接用LLM!以文字描述Observation(option)Goal“你要贏得勝利”LLM“我要下在5-5”轉譯為行動Action以...
发表评论取消回复