Agent:AI的智能小脑与双手

一.什么是Agent?

    Agent的中文名叫智能体,如果把LLM比作人类大脑的话,那么Agnet就是人类的小脑和双手。

    LLM的作用只有你输入一段Prompt给它,它给你输出一段结果,如果结果不满意,你就需要不断的跟它对话,并且回复结果也具有随机性,非常的不可控。那么如果我们想处理更复杂的任务,并且想让它输出的结果更加的精准和可控,这个时候就需要利用Agent,利用Agent可以让AI像人类一样拆解任务并逐一完成。

    我们可以用下图来展示Agnet在一个AI应用中的位置。

 

    上图中的Propmt和LLM应该都知道是什么意思了,如果不知道的话可以看我上一篇专门讲解Propmt的文章。那么图中的工具分别是什么意思,是用来做什么的呢?

    (1)工作流:字面意思,就是把一件事情拆分成多个小事情来做,有点像程序设计中的流程图,比如:先完成事项A,然后根据完成结果,判断是继续事项B,还是事项C,从而完成一些复杂的事情;

    (2)数据库:这个数据库指的是Agent内部的数据库,因为本身LLM是没有记忆功能的,加入数据库后,就可以把一些信息,比如与用户的对话内容结构化的存入数据库,让AI具备记忆的能力,在需要的时候调用出来;

    (3)向量库:RAG也叫知识库,向量库存储的信息是无结构化的知识,比如word内的文本,excel的数据,图片等等,如果想要去文件里查找需要数据,就需要把文件里面的内容向量化;

    (4)外部API:这个如果在IT行业的应该知道是什么意思,比如你可以调用高德的API来获取通勤时间,通过调用生成图片的API来完成图片的生成,调用文字转语音的API来把文字转化为语音等等;

    (5)触发器:想让LLM运行,必须要用户主动给它Prompt,当使用了触发器后,我们就可以设置满足什么条件,或触发定时器后,自动给LLM输入某些Prompt,来完成某些任务。

 

二.如何设计一个Agent?

    下面举一个小案例,来让大家对Agnet有一个更加直观的概念。

    你现在想要设计一款长租公寓推销AI,你希望它可以围绕长租公寓的优点去给用户推销,这个时候,你就可以使用工作流,把任务拆分:

1.设计一个工作流,名称叫CZGYTXY,如下:

 

设计思路:

(1)先设置一个循环,设定循环次数最多2次,只输出分数最高的那个循环的答案;

 

(2)把用户输入的内容带入循环,先输入给LLM(回答问题)

 

(2)再把LLM回答的结果给第二个LLM(打分)

 

(3)然后设置一个判断,如果本次得分>上次得分,就把本次得分的分数和答案更新成最佳的得分和答案,然后再判断这次的得分是否≥30分,及最高分,如果是,那么就终止循环,输出本次的答案及最佳答案,如果不是,那么继续循环;如果本次得分<上次得分,直接继续循环;最终如果循环2次还未得到≥30分的答案,就停止循环,并输出分数最高的答案。

 

 

2.编写一个Prompt,告诉LLM什么时候进入工作流:

 

这样一个简单的长租公寓智能推销AI就创建好了,我们来试试效果。

先问跟公寓无关的事情,它没进入工作流,而是直接给了回答,符合我设置的进入工作流的条件;

 

然后又问跟公寓相关的内容,成功进入工作流,并且输出了一段话。

 

我们打开调试,可以看到工作流一共循环了2次,得到了2个答案;

 

 

第一次的答案,是20分;

 

第二次的答案,是30分;

 

所以输出了第二次的答案。

 

三.总结

     AI回答的结果是具有很大的随机性的,常见的提高精准度的办法有:

    1、用工作流去控制整个 Agent 完成任务的具体步骤,结果就会更可控    

    2、某个步骤LLM 做的任务,可能出错的就让大模型自己纠错,或者增加一个节点做检测

    3、如果实在不好检测,那就设计一个能让LLM 犯错再自省的过程

    4、无论如何,中间产生的数据,是帮助我们提升最重要的抓手

    5、现阶段的水平固然重要,是否有进化能力更重要

    通过以上的案例,关于Agent,应该有了更直观的认知,一个AI应用里可以包含一个Agent,也可以包含多个Agent,了解Agent的所有功能,并且能够灵活运用,设计出符合企业要求的AI应用,是AI产品经理需要不断提高的能力。

 

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值