提到客服聊天机器人很多人就联想到了大模型微调,然后上手后发现并不能实现符合预期的聊天,这是一个误区,是因为对LLM任务线性流程的不了解,对整个AI工作流不理解,我们在处理LLM任务时需要考虑到多个实现方法,这是顺序,从即时工程开始>RaG>然后进行微调。把这些方法看做是解决问题的杠杆,你需要调节杠杆的配合才能处理复杂且个性化的应用需求,这些都是LLM所包含的主要能力,所以我们的工作就是优化这些能力。
开展LLM线性工作流
典型的 LLM 任务将从左下角的提示工程开始,我们在此进行测试、学习和评估以获得一个基准。一旦我们获得了基准示例并评估出它们不正确的原因,我们就可以采取其中一个措施:
工作流程中主要的问题包括
1、RAG 优化:
1)模型缺乏上下文知识(因为它不在其训练集中);
2)知识库过时,或不对;
3)需要专有信息知识,这是保证准确率最关键的因素。
2、LLM 优化:
1)模型产生的结果不一致且格式不正确;
2)语气或说话风格不正确;
3)推理没有得到一致遵循。这是保证准确率最关键的因素。
这个过程实际上变成了一系列优化步骤,我们评估、提出如何优化的假设、应用它并重新评估下一步
举例说明
在此示例中,我们执行以下操作:
[提示词]从提示词开始,输入提示词然后评估其表现
[提示词工程]添加样本参考,这应该可以提高结果的一致性
[RAG]添加检索步骤,以便根据问题动态地引入少量样本,这通过确保每个输入的相关上下文来提高性能
[微调大模型]准备 50 多个示例的数据集并微调模型以提高风格一致性
[RAG]调整检索并添加事实核查步骤来发现错误,从而实现更高的准确率
[RAG]使用包含增强型 RAG 输入的新训练示例重新训练微调模型
这是针对复杂个性化业务问题的典型优化流程,它帮助我们决定是否需要更多相关上下文,或者是否需要模型中更一致的行为。
举个不太恰当的形容 RAG像是知识库,微调像是嘴,提示词工程像是命令。虽然不太恰当但是你容易理解。
技术应用
可以用于打造AI客服,讲日常中的销售话术的模型进行训练,一个机器人代替百人、千人客服团队。
适时增加一些提醒,遇到问题的时候给管理员发送消息,开始时用AI和人工结合,逐渐脱离人工。
发表回复