建了工具,并且只使用了浏览器工具

Collaborate on cutting-edge hong kong data technologies and solutions.
Post Reply
rifat28dddd
Posts: 669
Joined: Fri Dec 27, 2024 12:23 pm

建了工具,并且只使用了浏览器工具

Post by rifat28dddd »

LATS实现流程 下面,风叔通过实际源码详细介绍了LATS模式的实现方法。关注公众号【风水云】并回复关键词【LATS源码】即可获取LATS设计模板完整源码。第一步是构建树的节点 LATS 基于蒙特卡罗树搜索。


对于每个搜索步骤,它选择具有最高“置信上限”的节点,具有平衡发展(最高平均奖励)和研究(最低访问次数)的指标。从该节点开始,它生成 N(在本例中为 5)个新的候选操作并将它们添加到树中。


当生成有效解或达到最大次数(搜索树的深度)时,搜索停止。在 Node 节点中我们定义了几个关键函数: best_child:选择 UCT 最高的孩子进行下一次搜索 best_child_score:返回高度值最高的孩子:检查进度树的深度 upper_confidence_bound:返回 UCT 分数以平衡探索和分支用法 backpropogate:使用反向传播来更新此节点及其父节点的结果 get_trajectories:获取代表此搜索分支的消息 get_best_solution:返回当前子树中的最佳解决方案 第二步是构建 Agent 代理将主要解决三件事: 反射:根据工具执行响应的结果进行评分 初始响应:创建根节点并开始搜索 扩展:从最佳开始在当前树中的位置,生成接下来的5步候选 对于更实际的应用,例如代码生成,可以将代码执行的结果集成到反馈或奖励中。


对于Agent,我们首先创。然后构建一个反射系统,根据决策 卡塔尔 whatsapp 数据 具使用的结果来评估代理的输出。我们将在其他两个节点中调用此方法。然后,我们从根节点开始,根据用户输入进行响应。


然后,从根节点开始,我们将候选节点生成和反射封装到单个节点中。第三步生成候选节点 对于每个节点,生成 5 个候选节点进行探索。下面将候选节点和反射节点生成步骤封装成扩展节点,所有操作都以批处理方式进行,以加快执行速度。


步骤:创建流程图然后我们构建流程图并添加基础节点和扩展节点至此,整个LATS的基本逻辑就呈现出来了。关注公众号【风水云】并回复关键词【LATS源码】即可获取LATS设计模板完整源码。总结 与其他基于树的方法相比,LATS 实现了自反推理步骤,显着提高了性能。


当采取行动时,LATS 不仅使用来自环境的反馈,还结合来自语言模型的反馈来确定是否存在推理错误并建议替代方案。这种自我反思的能力,结合强大的搜索算法,使得LATS更适合处理一些相对复杂的任务。
Post Reply