type
status
date
slug
summary
tags
category
icon
password
前言: Llama3 模型在 ReAct 范式下的智能体能力并不出众,所以尝试着使用 XTuner 在 Agent-FLAN 数据集上微调 Llama3-8B-Instruct,以让 Llama3-8B-Instruct 模型获得智能体能力。

环境配置

XTuner+Agent-FLAN微调

机智流非常贴心的为我们准备了自己训练的权重,可以使用如下的指令合并权重:

微调后Agent能力体验

先来安装 lagent、
启动Web demo
  • 微调前 LLaMA3 路径:/root/model/Meta-Llama-3-8B-Instruct
  • 微调后 LLaMA3 路径:/root/llama3_agent_pth/merged
notion image
模型成功的调用了工具,并完成了响应
 
NVM——Node版本管理器VSCode 代码自动格式化
  • Giscus
Zachary_Yang
Zachary_Yang
一个普通的干饭人🍚
Announcement
🎉欢迎来到我的博客🎉
-- 亲爱的读者们,你们好! ---
👏在这里,我希望能够和你们一起分享我对生活的观察、对技术的理解和热爱,暂将博客分为以下几个栏目👏
🌿 心绪漫卷边:一些小随笔
🌌 智绘非遇路:AI领域
😊 浅笑编程边:前后端开发
🛠 技术汇流石下:零散技术分享

祝好,
Zachary_Yang