原创 从"过渡方案"到"必需品",RAG技术2025年如何逆袭成AI基建?
创始人
2025-12-23 20:47:22

2025年的AI圈,有个话题吵得比夏天的蚊子还烦人RAG技术到底还行不行?前阵子刷行业群,有人甩了张截图。

某大厂AI实验室的内部邮件里说"RAG是过渡方案,资源优先投大模型原生应用",底下立马有人跟帖,"可我们公司上周刚签了三百万的RAG项目啊..."

这种分裂感,最近跟做AI产品的朋友聊天时特别明显,有个朋友吐槽,他们团队今年的KPI里,RAG相关的需求占了40%,但老板开会又总问"能不能用长上下文模型把RAG替掉"。

这事儿挺有意思一边是专家们讨论"后RAG时代",一边是企业端的订单量还在涨。

企业为啥戒不掉RAG?

要说质疑,确实不是空穴来风,最常见的声音是"RAG就是个创可贴"。

有学者写文章说,等大模型的长上下文窗口再大点,知识更新再快点,RAG这种"外挂知识库"的模式就该被淘汰了。

这话听着有道理,毕竟谁不想一步到位呢,可企业的实际情况没那么理想。

我接触过一家制造业的AI负责人,他们厂里的设备手册、工艺参数隔三差五就更新,总不能每次都让大模型重训一遍吧?RAG往知识库塞个新文档,半小时就能用,这点目前还真没替代品。

还有人说RAG被AIAgents抢了风头,今年Agent火得一塌糊涂,各种"自主决策""多工具调用"的宣传满天飞,RAG的讨论度确实降了不少。

但Agent跑起来不得需要数据吗?用户问"上个月的销售数据怎么样",Agent还得靠RAG去扒数据库里的表格,不然不就成了瞎回答?

中大型组织反倒在偷偷加码,我看某咨询公司的报告,2025年Q1,员工规模超千人的企业,RAG相关投入同比涨了快一倍。

不是简单搭个知识库,而是搞系统化建设数据清洗、权限管理、多模态支持,一套流程下来,投入不比搭个小模型少,这哪像是要淘汰的样子?

吐槽归吐槽,技术迭代可没闲着,今年行业里悄悄冒出不少新玩法,把RAG从"补丁"往"基建"上拉。

最明显的变化,就是不再死磕"RAGvs长上下文",而是琢磨怎么让它俩搭伙干活。

RAG技术怎么偷偷升级的?

之前大家觉得长上下文能替代RAG,是觉得"上下文够长,知识直接塞进去不就完了"。

但实际用起来才发现问题比如你问一份500页报告里的某个细节,长上下文模型经常把中间几页的内容给忘了,业内叫"中间迷失"效应。

后来有人想了个招,先让RAG把相关的段落挑出来,再塞给长上下文模型,相当于RAG当"筛子",长上下文当"精读老师"。

我见过一个法律AI产品,用户上传几十份案例,RAG先检索出最相关的3份,再让大模型基于这3份生成分析,准确率比纯长上下文高了不少。

更狠的是把RAG的流程拆开揉碎了改,以前检索和搜索是混在一起的,现在有人把它分成两步,先"广撒网"搜索,再"精准捞鱼"检索。

比如搜"AI伦理",先找相关的文档,再从文档里拆出句子、段落甚至关键词,一层层缩小范围。

这样一来,既不会漏掉重要信息,又能减少噪音。

TreeRAG就是个典型例子,离线的时候把文档拆成树状结构,像书的目录一样,有章节、小节、段落摘要。

用户提问时,先定位到哪一章,再到哪一节,最后把相关的内容拼起来,这招挺聪明,有点像我们查字典,先按部首,再找页码,比一页页翻快多了。

GraphRAG则是另一个思路,搞知识图谱,从文档里抽人物、公司、事件这些实体,再把它们的关系理清楚。

比如"苹果"和"乔布斯"是"创立"关系,"iPhone"和"苹果"是"产品"关系。

但这玩意儿也麻烦,实体关系容易搞错,还特费Token,目前也就金融、法律这些对关系敏感的领域在用,现在更流行的是混搭TreeRAG搭骨架,GraphRAG填血肉。

比如分析一份财报,先用TreeRAG定位到"营收"章节,再用GraphRAG把"营收"和"成本""利润"的关系理清楚,我觉得这可能是未来的方向,毕竟没有哪种技术是万能的,搭伙过日子才靠谱。

技术在升级,RAG的角色也在变,以前它就是个知识库,问啥答啥。

现在不一样了,AIAgent火了之后,RAG开始当"数据管家",Agent需要啥数据,它就给啥数据。

比如你让AIAgent帮你安排出差,它得知道你的行程偏好、公司的差旅政策、目的地的天气。

这些数据可能散在邮件、文档、App里,RAG就负责把这些信息捞出来,整理好给Agent,这时候RAG就不是单独的工具了,而是Agent的"后勤部长"。

数据处理的管道也越来越讲究,以前上传个PDF,能识别文字就不错了。

现在还能提取表格、图片里的信息,甚至把手写笔记转成结构化数据,有个做医疗AI的朋友跟我说,他们现在能用RAG处理CT报告里的影像描述,再结合病历数据,辅助医生诊断。

RAG现在就像个默默攒经验的游戏角色,表面看还是那个"检索增强生成",背地里已经把技能点加到了数据处理、上下文管理上。

以前是"你问我答"的客服,现在快成了"帮你整理资料、协调资源"的助理,行业里有人说,2025年是RAG的"成年礼"。

从被质疑"是不是过渡方案",到成为AIAgent的基础设施,它用实打实的需求和技术升级回应了质疑,可能未来还会有新的技术挑战,但至少现在,RAG已经从"可有可无的创可贴",长成了"缺它不行的承重墙"。

我觉得这事儿挺有意思技术的发展从来不是非此即彼,更多是在争议里找到自己的位置,RAG的故事,可能就是AI行业的一个缩影:没有永远的"临时工",只有不肯进化的"旧思维"。

⚠️
本网站信息内容及素材来源于网络采集或用户发布,如涉及侵权,请及时联系我们,发送链接至2697952338@QQ.COM,我们将第一时间进行核实与删除处理。

相关内容

热门资讯

莫奥信息申请基于B2B2C商城... 国家知识产权局信息显示,深圳市莫奥信息服务有限公司申请一项名为“基于B2B2C商城的优惠券发放方法、...
壹快评|存取现金超5万元不需再... 2026年新年第一天,《金融机构客户尽职调查和客户身份资料及交易记录保存管理办法》(下称《管理办法》...
微信分付额度秒出!最高8000... 最近,我的朋友圈被微信“分付”刷屏了。点开好友的微信钱包,那个醒目的额度数字,着实让人羡慕。 这不就...
微信立大功!200块解决几十万... 据新华社、极目新闻等媒体综合报道, 浙江省温州市一小区因使用手机微信替代传统门铃的做法而突然爆火。 ...
支付宝申请筛选训练样本方法专利... 国家知识产权局信息显示,支付宝(杭州)数字服务技术有限公司申请一项名为“一种筛选训练样本的方法及装置...
支付宝申请模型训练方法专利,提... 国家知识产权局信息显示,支付宝(杭州)数字服务技术有限公司申请一项名为“模型训练方法、广告投放方法、...
支付宝取得图像活体检测方法专利 国家知识产权局信息显示,支付宝(杭州)数字服务技术有限公司取得一项名为“一种图像活体检测方法、装置、...
山姆与小象超市共享同一供应商?... 近日,有网友发帖称,小象超市与山姆会员商店的供应链已趋同,自己在两家实体店购买的多款产品来源一致,因...
浙江专业市场迎新变局 批发重镇... 中新网嘉兴1月2日电(胡丰盛)元旦期间,全国最大的羊毛衫市场——浙江省桐乡市濮院镇,挤满了提着购物袋...