type
status
date
slug
summary
tags
category
icon
password
前言: Llama3 模型在 ReAct 范式下的智能体能力并不出众,所以尝试着使用 XTuner 在 Agent-FLAN 数据集上微调 Llama3-8B-Instruct,以让 Llama3-8B-Instruct 模型获得智能体能力。
环境配置
XTuner+Agent-FLAN微调
机智流非常贴心的为我们准备了自己训练的权重,可以使用如下的指令合并权重:
微调后Agent能力体验
先来安装 lagent、
启动Web demo
- 微调前 LLaMA3 路径:
/root/model/Meta-Llama-3-8B-Instruct
- 微调后 LLaMA3 路径:
/root/llama3_agent_pth/merged
模型成功的调用了工具,并完成了响应
- Author:Zachary_Yang
- URL:https://notion-next-git-main-little1ds-projects.vercel.app//8c754558e57e44439dd5e1066b024969
- Copyright:All articles in this blog, except for special statements, adopt BY-NC-SA agreement. Please indicate the source!
Relate Posts