2025年的AI圈,有个话题吵得比夏天的蚊子还烦人RAG技术到底还行不行?前阵子刷行业群,有人甩了张截图。
某大厂AI实验室的内部邮件里说"RAG是过渡方案,资源优先投大模型原生应用",底下立马有人跟帖,"可我们公司上周刚签了三百万的RAG项目啊..."
这种分裂感,最近跟做AI产品的朋友聊天时特别明显,有个朋友吐槽,他们团队今年的KPI里,RAG相关的需求占了40%,但老板开会又总问"能不能用长上下文模型把RAG替掉"。
这事儿挺有意思一边是专家们讨论"后RAG时代",一边是企业端的订单量还在涨。

企业为啥戒不掉RAG?
要说质疑,确实不是空穴来风,最常见的声音是"RAG就是个创可贴"。
有学者写文章说,等大模型的长上下文窗口再大点,知识更新再快点,RAG这种"外挂知识库"的模式就该被淘汰了。
这话听着有道理,毕竟谁不想一步到位呢,可企业的实际情况没那么理想。
我接触过一家制造业的AI负责人,他们厂里的设备手册、工艺参数隔三差五就更新,总不能每次都让大模型重训一遍吧?RAG往知识库塞个新文档,半小时就能用,这点目前还真没替代品。

还有人说RAG被AIAgents抢了风头,今年Agent火得一塌糊涂,各种"自主决策""多工具调用"的宣传满天飞,RAG的讨论度确实降了不少。
但Agent跑起来不得需要数据吗?用户问"上个月的销售数据怎么样",Agent还得靠RAG去扒数据库里的表格,不然不就成了瞎回答?
中大型组织反倒在偷偷加码,我看某咨询公司的报告,2025年Q1,员工规模超千人的企业,RAG相关投入同比涨了快一倍。
不是简单搭个知识库,而是搞系统化建设数据清洗、权限管理、多模态支持,一套流程下来,投入不比搭个小模型少,这哪像是要淘汰的样子?

吐槽归吐槽,技术迭代可没闲着,今年行业里悄悄冒出不少新玩法,把RAG从"补丁"往"基建"上拉。
最明显的变化,就是不再死磕"RAGvs长上下文",而是琢磨怎么让它俩搭伙干活。
RAG技术怎么偷偷升级的?
之前大家觉得长上下文能替代RAG,是觉得"上下文够长,知识直接塞进去不就完了"。
但实际用起来才发现问题比如你问一份500页报告里的某个细节,长上下文模型经常把中间几页的内容给忘了,业内叫"中间迷失"效应。

后来有人想了个招,先让RAG把相关的段落挑出来,再塞给长上下文模型,相当于RAG当"筛子",长上下文当"精读老师"。
我见过一个法律AI产品,用户上传几十份案例,RAG先检索出最相关的3份,再让大模型基于这3份生成分析,准确率比纯长上下文高了不少。
更狠的是把RAG的流程拆开揉碎了改,以前检索和搜索是混在一起的,现在有人把它分成两步,先"广撒网"搜索,再"精准捞鱼"检索。
比如搜"AI伦理",先找相关的文档,再从文档里拆出句子、段落甚至关键词,一层层缩小范围。
这样一来,既不会漏掉重要信息,又能减少噪音。

TreeRAG就是个典型例子,离线的时候把文档拆成树状结构,像书的目录一样,有章节、小节、段落摘要。
用户提问时,先定位到哪一章,再到哪一节,最后把相关的内容拼起来,这招挺聪明,有点像我们查字典,先按部首,再找页码,比一页页翻快多了。
GraphRAG则是另一个思路,搞知识图谱,从文档里抽人物、公司、事件这些实体,再把它们的关系理清楚。
比如"苹果"和"乔布斯"是"创立"关系,"iPhone"和"苹果"是"产品"关系。

但这玩意儿也麻烦,实体关系容易搞错,还特费Token,目前也就金融、法律这些对关系敏感的领域在用,现在更流行的是混搭TreeRAG搭骨架,GraphRAG填血肉。
比如分析一份财报,先用TreeRAG定位到"营收"章节,再用GraphRAG把"营收"和"成本""利润"的关系理清楚,我觉得这可能是未来的方向,毕竟没有哪种技术是万能的,搭伙过日子才靠谱。
技术在升级,RAG的角色也在变,以前它就是个知识库,问啥答啥。
现在不一样了,AIAgent火了之后,RAG开始当"数据管家",Agent需要啥数据,它就给啥数据。

比如你让AIAgent帮你安排出差,它得知道你的行程偏好、公司的差旅政策、目的地的天气。
这些数据可能散在邮件、文档、App里,RAG就负责把这些信息捞出来,整理好给Agent,这时候RAG就不是单独的工具了,而是Agent的"后勤部长"。
数据处理的管道也越来越讲究,以前上传个PDF,能识别文字就不错了。
现在还能提取表格、图片里的信息,甚至把手写笔记转成结构化数据,有个做医疗AI的朋友跟我说,他们现在能用RAG处理CT报告里的影像描述,再结合病历数据,辅助医生诊断。

RAG现在就像个默默攒经验的游戏角色,表面看还是那个"检索增强生成",背地里已经把技能点加到了数据处理、上下文管理上。
以前是"你问我答"的客服,现在快成了"帮你整理资料、协调资源"的助理,行业里有人说,2025年是RAG的"成年礼"。
从被质疑"是不是过渡方案",到成为AIAgent的基础设施,它用实打实的需求和技术升级回应了质疑,可能未来还会有新的技术挑战,但至少现在,RAG已经从"可有可无的创可贴",长成了"缺它不行的承重墙"。
我觉得这事儿挺有意思技术的发展从来不是非此即彼,更多是在争议里找到自己的位置,RAG的故事,可能就是AI行业的一个缩影:没有永远的"临时工",只有不肯进化的"旧思维"。