admin管理员组文章数量:1036105
Agentic RAG:超越传统RAG与案例分享
在人工智能快速发展的今天,检索增强生成(Retrieval-Augmented Generation,简称 RAG)技术已经成为大语言模型(LLM)应用的关键突破。RAG 框架不断推陈出新、日新月异,从 Navie RAG、高级 RAG、模块化 RAG,发展到现在的 Graph based RAG,甚至混合高级 RAG 与 GraphRAG 的 HybridRAG。那么,如何在日新月异的 RAG 技术下,开发一种能够不断适应的框架呢?今天,我们将深入探讨 Agentic RAG,这一革命性的方法正在重新定义智能信息检索与生成的边界。
本文先讨论 Agentic RAG 常见范式,然后推荐一些流行的 Agentic RAG 开发示例:Nvidia 的 Agentic RAG 案例和基于 LlamaIndex 的 Agentic RAG 设计等。
1. Agentic RAG:智能决策的新范式
传统 RAG 系统的工作方式相对简单:接收用户查询 → 检索相关文档 → 基于文档生成答案。但在实际应用中,这种线性模式通常显得过于刻板和局限。现实世界的问题往往错综复杂,需要更加智能和灵活的方案。
Agentic RAG 引入了一个关键概念:让 Agent 在整个信息检索和生成过程中主动思考和决策。这不仅仅是一个技术术语,而是一种全新的智能工作范式。
1. 查询分析:智能重构
在 Agentic RAG 中,原始用户查询不再被直接照搬,而是经过精细的分析和重构:
- 查询重写:将模糊或复杂的查询转化为更加精确、可检索的形式
- 智能路由:判断是否需要额外的数据源来全面回答问题
想象一下,用户询问"最近的天气对公司销售有什么影响"。传统 RAG 可能会束手无策,而 Agentic RAG 会:
- 识别需要整合销售数据和天气信息
- 智能地从不同数据源检索相关信息
- 综合分析并生成有洞察力的答案
2. 多源数据检索:打破信息孤岛
Agentic RAG 的一大优势在于其灵活的数据检索能力:
- 实时用户数据:根据用户当前上下文动态调整
- 内部文档:精准匹配组织内部知识
- 外部数据源:从互联网实时获取最新信息
举个例子,对于一个客户支持场景,系统可以:
- 查看用户历史工单
- 检索产品使用手册
- 获取最新的技术更新信息
- 综合生成最精准的解决方案
3. 动态答案生成与优化
Agentic RAG 不满足于仅仅给出一个答案,而是通过多轮迭代不断优化:
- 生成多个候选答案
- 评估每个答案的准确性和相关性
- 必要时重新查询或调整生成策略
4. 从失败中学习:自我修正机制
传统系统遇到无法回答的问题往往会直接告诉用户"无法解决"。而 Agentic RAG 则会:
- 识别信息鸿沟
- 主动寻找补充信息源
- 尝试重新生成更优答案
2. Agentic RAG 资源推荐
1. Nvidia Agentic RAG
Nvidia 展示的 Agentic RAG 只是一个示例,参考了如下 3 篇论文实现。
- 路由 (Adaptive-RAG[1]). 根据问题路由到不同的检索器
- 回退 (Corrective RAG[2]). 如果文档与查询不相关,则回退到网络搜索
- 自纠错 (Self-RAG[3]). 当答案具有幻觉或者未能回答问题时候,自动尝试修正答案。
它基本实现了如下图所示的框架,它使用打分机制评判答案是否包含幻觉,是否需要加入新的信息。具体地址可以参考:.ipynb,整个代码基于Langchain开发,使用流程编排完成,包含大量的Prompt设计。
这个项目还包含ChatUI,可以显示具体的运行流程,如下图所示。
2. LlamaIndex Agentic RAG
DeepLearning.ai 的课程Agentic RAG[4],由 LlamaIndex 的创始人 Jerry Liu 讲授,描述了一种使用 LlamaIndex 如何构建 Agentic RAG 的流程。它将文档包含检索等流程包装成为一个 Tool,然后包装到 Agent 中,供路由选择调用。而在路由前,它会尝试分解或重写用户查询,然后交给 Router,大概设计流程如下。
agentic-rag-llama
比如你可能会问:“比较一下 adapt rag 和 self-rag,首先分析各个论文中的方法”,查询重写模块可能会将用户提问分解为:
- adapt rag 中的方法
- self rag 中的方法
- 对比 self rag 和 adapt rag
然后 Router 会分别调用 self rag 的 summary tool 和 adapt rag 的 summary tool,然后由 LLM 进行总结输出。
更为具体代码设计,可访问课程:。
结语
Agentic RAG 不仅仅是一种技术,更是一种思维方式。它代表了从被动检索到主动学习、从静态匹配到动态智能的巨大飞跃。
参考资料
[1]
Adaptive-RAG:.14403
[2]
Corrective RAG:.15884.pdf
[3]
Self-RAG:.11511
[4]
Agentic RAG:
本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。原始发表:2024-12-01,如有侵权请联系 cloudcommunity@tencent 删除设计系统开发框架路由Agentic RAG:超越传统RAG与案例分享
在人工智能快速发展的今天,检索增强生成(Retrieval-Augmented Generation,简称 RAG)技术已经成为大语言模型(LLM)应用的关键突破。RAG 框架不断推陈出新、日新月异,从 Navie RAG、高级 RAG、模块化 RAG,发展到现在的 Graph based RAG,甚至混合高级 RAG 与 GraphRAG 的 HybridRAG。那么,如何在日新月异的 RAG 技术下,开发一种能够不断适应的框架呢?今天,我们将深入探讨 Agentic RAG,这一革命性的方法正在重新定义智能信息检索与生成的边界。
本文先讨论 Agentic RAG 常见范式,然后推荐一些流行的 Agentic RAG 开发示例:Nvidia 的 Agentic RAG 案例和基于 LlamaIndex 的 Agentic RAG 设计等。
1. Agentic RAG:智能决策的新范式
传统 RAG 系统的工作方式相对简单:接收用户查询 → 检索相关文档 → 基于文档生成答案。但在实际应用中,这种线性模式通常显得过于刻板和局限。现实世界的问题往往错综复杂,需要更加智能和灵活的方案。
Agentic RAG 引入了一个关键概念:让 Agent 在整个信息检索和生成过程中主动思考和决策。这不仅仅是一个技术术语,而是一种全新的智能工作范式。
1. 查询分析:智能重构
在 Agentic RAG 中,原始用户查询不再被直接照搬,而是经过精细的分析和重构:
- 查询重写:将模糊或复杂的查询转化为更加精确、可检索的形式
- 智能路由:判断是否需要额外的数据源来全面回答问题
想象一下,用户询问"最近的天气对公司销售有什么影响"。传统 RAG 可能会束手无策,而 Agentic RAG 会:
- 识别需要整合销售数据和天气信息
- 智能地从不同数据源检索相关信息
- 综合分析并生成有洞察力的答案
2. 多源数据检索:打破信息孤岛
Agentic RAG 的一大优势在于其灵活的数据检索能力:
- 实时用户数据:根据用户当前上下文动态调整
- 内部文档:精准匹配组织内部知识
- 外部数据源:从互联网实时获取最新信息
举个例子,对于一个客户支持场景,系统可以:
- 查看用户历史工单
- 检索产品使用手册
- 获取最新的技术更新信息
- 综合生成最精准的解决方案
3. 动态答案生成与优化
Agentic RAG 不满足于仅仅给出一个答案,而是通过多轮迭代不断优化:
- 生成多个候选答案
- 评估每个答案的准确性和相关性
- 必要时重新查询或调整生成策略
4. 从失败中学习:自我修正机制
传统系统遇到无法回答的问题往往会直接告诉用户"无法解决"。而 Agentic RAG 则会:
- 识别信息鸿沟
- 主动寻找补充信息源
- 尝试重新生成更优答案
2. Agentic RAG 资源推荐
1. Nvidia Agentic RAG
Nvidia 展示的 Agentic RAG 只是一个示例,参考了如下 3 篇论文实现。
- 路由 (Adaptive-RAG[1]). 根据问题路由到不同的检索器
- 回退 (Corrective RAG[2]). 如果文档与查询不相关,则回退到网络搜索
- 自纠错 (Self-RAG[3]). 当答案具有幻觉或者未能回答问题时候,自动尝试修正答案。
它基本实现了如下图所示的框架,它使用打分机制评判答案是否包含幻觉,是否需要加入新的信息。具体地址可以参考:.ipynb,整个代码基于Langchain开发,使用流程编排完成,包含大量的Prompt设计。
这个项目还包含ChatUI,可以显示具体的运行流程,如下图所示。
2. LlamaIndex Agentic RAG
DeepLearning.ai 的课程Agentic RAG[4],由 LlamaIndex 的创始人 Jerry Liu 讲授,描述了一种使用 LlamaIndex 如何构建 Agentic RAG 的流程。它将文档包含检索等流程包装成为一个 Tool,然后包装到 Agent 中,供路由选择调用。而在路由前,它会尝试分解或重写用户查询,然后交给 Router,大概设计流程如下。
agentic-rag-llama
比如你可能会问:“比较一下 adapt rag 和 self-rag,首先分析各个论文中的方法”,查询重写模块可能会将用户提问分解为:
- adapt rag 中的方法
- self rag 中的方法
- 对比 self rag 和 adapt rag
然后 Router 会分别调用 self rag 的 summary tool 和 adapt rag 的 summary tool,然后由 LLM 进行总结输出。
更为具体代码设计,可访问课程:。
结语
Agentic RAG 不仅仅是一种技术,更是一种思维方式。它代表了从被动检索到主动学习、从静态匹配到动态智能的巨大飞跃。
参考资料
[1]
Adaptive-RAG:.14403
[2]
Corrective RAG:.15884.pdf
[3]
Self-RAG:.11511
[4]
Agentic RAG:
本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。原始发表:2024-12-01,如有侵权请联系 cloudcommunity@tencent 删除设计系统开发框架路由本文标签: Agentic RAG超越传统RAG与案例分享
版权声明:本文标题:Agentic RAG:超越传统RAG与案例分享 内容由热心网友自发贡献,该文观点仅代表作者本人, 转载请联系作者并注明出处:http://it.en369.cn/jiaocheng/1748222741a2271603.html, 本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容,一经查实,本站将立刻删除。
发表评论