admin管理员组

文章数量:1027474

AI超级智能体教程(七)

1.RAG实战–本地知识库的应用

1.1编写代码

我们的文档添加到这个向量数据库里面去:

image-20250504154631639

基于我们的知识库进行问答:我们的prompt+拦截器从向量数据库里面找到的上下文,两个组合在一起,发给我们的AI大模型,这个是大致的流程;

image-20250504154729868

1.2调试观察效果

为什么要进行调试,因为我认为调试可以帮助我们大家更好的进行理解这个过程,知道这个过程里面都发生了什么事情:

image-20250504153902275

然后看一下他是不是从我们的知识库里面找到了比较匹配的这个内容?

实际上我们可以发现,他已经从我们的本地的知识库里面找到了几个比较符合的内容,如下所示

image-20250504154034563

你不会以为这个排序是随便排列的把,不是的,这个里面实际上是有一个score的,这个里面的分数实际上就是从高到低的这个顺序进行排列的,而且这个分数越高,表示我们的本地知识库里面搜索出来的这个内容和我们的用户输入的这个提示词的吻合度是更高的;

image-20250504154305295

1.3输出结果

实际上仔细观察这个输出的结果,我们的这个回答就是从我们的本地的知识库里面去找到的,也就是我们的那三个md文档

image-20250504154529846

2.RAG实战–云端知识库的应用

2.1新建云端知识库

这个主要是使用的阿里云百炼的云端知识库的平台,下面的这个步骤是我们后续进行这个云端的知识库开发的这个基础,大家实际需要重视一下的,基本上就是让这个云平台帮助我们进行这个文档的切分操作之类的;

image-20250504155514579

接下来需要对于我们的文档进行上传,第一次使用的话需要点击这个数据中心把这个文档上传一下即可;

image-20250504155916486

下面的这个属性很重要,就是这个metadata,这个主要就是使用的类似于标签,或者说是索引,方便我们从知识库里面的内容进行相关的过滤和筛选,否则的话我们只能通过这个关键词相似程度进行匹配,打了标签之后就会选择更加适合的推荐给我们的使用者用户;

因此这个配置还是打开一下最好;

image-20250504162208717

导入成功之后,大家就会发现这个平台会根据自己的这个规则把我们的文档进行切分,如下所示,我自己从本地上传的这个文档都是直接切分成为了三个切片的,这个就是平台智能切分的这个结果;

image-20250504163336060

2.2使用知识库

image-20250504163738249

2.3断点调试

这个时候我们会发现这个request打断点的位置内容和刚才的本地的知识库的差别还是很大的,大家可以去回顾一下本地的知识库的,这个云端知识库应该是直接加进来了,内容还是很多的;

image-20250504164244328

这个时候云端知识库检索的结果是5个,可以喝上面的本地的知识库进行对比一下,就可以发现两个的差别;大家进行学习的时候,也可以使用这个方式,对比一下两个方式的异同点;

image-20250504164409491

2.4输出结果

这个测试的结果就是从我们的知识库里面搞得,我觉得这个也是很不错的,因为这个排版啥的,整体上应该是闭刚刚我们自己本地的效果还一些,这个也是建议大家使用云端的原因之一了;

的知识库里面搞得,我觉得这个也是很不错的,因为这个排版啥的,整体上应该是闭刚刚我们自己本地的效果还一些,这个也是建议大家使用云端的原因之一了;

image-20250504164545094
本文参与 腾讯云自媒体同步曝光计划,分享自作者个人站点/博客。 原始发表:2025-05-04,如有侵权请联系 cloudcommunity@tencent 删除调试教程模型数据中心搜索

AI超级智能体教程(七)

1.RAG实战–本地知识库的应用

1.1编写代码

我们的文档添加到这个向量数据库里面去:

image-20250504154631639

基于我们的知识库进行问答:我们的prompt+拦截器从向量数据库里面找到的上下文,两个组合在一起,发给我们的AI大模型,这个是大致的流程;

image-20250504154729868

1.2调试观察效果

为什么要进行调试,因为我认为调试可以帮助我们大家更好的进行理解这个过程,知道这个过程里面都发生了什么事情:

image-20250504153902275

然后看一下他是不是从我们的知识库里面找到了比较匹配的这个内容?

实际上我们可以发现,他已经从我们的本地的知识库里面找到了几个比较符合的内容,如下所示

image-20250504154034563

你不会以为这个排序是随便排列的把,不是的,这个里面实际上是有一个score的,这个里面的分数实际上就是从高到低的这个顺序进行排列的,而且这个分数越高,表示我们的本地知识库里面搜索出来的这个内容和我们的用户输入的这个提示词的吻合度是更高的;

image-20250504154305295

1.3输出结果

实际上仔细观察这个输出的结果,我们的这个回答就是从我们的本地的知识库里面去找到的,也就是我们的那三个md文档

image-20250504154529846

2.RAG实战–云端知识库的应用

2.1新建云端知识库

这个主要是使用的阿里云百炼的云端知识库的平台,下面的这个步骤是我们后续进行这个云端的知识库开发的这个基础,大家实际需要重视一下的,基本上就是让这个云平台帮助我们进行这个文档的切分操作之类的;

image-20250504155514579

接下来需要对于我们的文档进行上传,第一次使用的话需要点击这个数据中心把这个文档上传一下即可;

image-20250504155916486

下面的这个属性很重要,就是这个metadata,这个主要就是使用的类似于标签,或者说是索引,方便我们从知识库里面的内容进行相关的过滤和筛选,否则的话我们只能通过这个关键词相似程度进行匹配,打了标签之后就会选择更加适合的推荐给我们的使用者用户;

因此这个配置还是打开一下最好;

image-20250504162208717

导入成功之后,大家就会发现这个平台会根据自己的这个规则把我们的文档进行切分,如下所示,我自己从本地上传的这个文档都是直接切分成为了三个切片的,这个就是平台智能切分的这个结果;

image-20250504163336060

2.2使用知识库

image-20250504163738249

2.3断点调试

这个时候我们会发现这个request打断点的位置内容和刚才的本地的知识库的差别还是很大的,大家可以去回顾一下本地的知识库的,这个云端知识库应该是直接加进来了,内容还是很多的;

image-20250504164244328

这个时候云端知识库检索的结果是5个,可以喝上面的本地的知识库进行对比一下,就可以发现两个的差别;大家进行学习的时候,也可以使用这个方式,对比一下两个方式的异同点;

image-20250504164409491

2.4输出结果

这个测试的结果就是从我们的知识库里面搞得,我觉得这个也是很不错的,因为这个排版啥的,整体上应该是闭刚刚我们自己本地的效果还一些,这个也是建议大家使用云端的原因之一了;

的知识库里面搞得,我觉得这个也是很不错的,因为这个排版啥的,整体上应该是闭刚刚我们自己本地的效果还一些,这个也是建议大家使用云端的原因之一了;

image-20250504164545094
本文参与 腾讯云自媒体同步曝光计划,分享自作者个人站点/博客。 原始发表:2025-05-04,如有侵权请联系 cloudcommunity@tencent 删除调试教程模型数据中心搜索

本文标签: AI超级智能体教程(七)