Llama 3 Agent 能力体验与微调（Lagent 版） | 云端思绪录

type

status

date

slug

summary

tags

category

icon

password

前言： Llama3 模型在 ReAct 范式下的智能体能力并不出众，所以尝试着使用 XTuner 在 Agent-FLAN 数据集上微调 Llama3-8B-Instruct，以让 Llama3-8B-Instruct 模型获得智能体能力。

环境配置

XTuner+Agent-FLAN微调

机智流非常贴心的为我们准备了自己训练的权重，可以使用如下的指令合并权重：

微调后Agent能力体验

先来安装 lagent、

启动Web demo

微调前 LLaMA3 路径：/root/model/Meta-Llama-3-8B-Instruct

微调后 LLaMA3 路径：/root/llama3_agent_pth/merged

notion image

模型成功的调用了工具，并完成了响应

Author:Zachary_Yang
URL:https://notion-next-git-main-little1ds-projects.vercel.app//8c754558e57e44439dd5e1066b024969
Copyright:All articles in this blog, except for special statements, adopt BY-NC-SA agreement. Please indicate the source!

Relate Posts

🤔一文跑通超分baseline

Git LFS(Large File Storage)

LLama3小羊驼

epsilon-greedy 策略

颜色空间——RGB and YCbCr

NVM——Node版本管理器 VSCode 代码自动格式化

Giscus

Zachary_Yang

Zachary_Yang

一个普通的干饭人🍚

Latest posts

Announcement

🎉欢迎来到我的博客🎉

-- 亲爱的读者们，你们好！ ---

👏在这里，我希望能够和你们一起分享我对生活的观察、对技术的理解和热爱，暂将博客分为以下几个栏目👏

🌿 心绪漫卷边：一些小随笔

🌌 智绘非遇路：AI领域

😊 浅笑编程边：前后端开发

🛠 技术汇流石下：零散技术分享

祝好，

Zachary_Yang