“龙虾”使知识工作高度自动化,一旦用上就再也不会回头!
——————————————
很多时候,我们都需要找到某种说法的出处、或者某种说法是否可靠、它的原始出处在哪里,这就需要开展广泛的“文献调研”。
比如,前几天我读到一段文字:
《科学》杂志报导:哈佛团队追踪了三千多人后发现,每天久坐超8小时的人,晚上花20分钟做点中高强度运动——快走、慢跑、跳操都行——第二天体内的炎症因子水平,竟跟没久坐的人差不多
这段文字是真、是假?是出自哪一篇研究论文?还是作者杜撰的、或者是某些研究成果的综合?
这就需要我们开展文献调研。
我们能开展文献调研的方法,无外乎如下几种:
纯人工:这个显然是非常困难的
搜索引擎:一般难以实现,因为它采用的“关键词匹配”策略,对于文献调研是无法实现的
通用大模型:最新的通用大模型(如DeepSeek 4.0)有时能取得不错的效果,不过对于非开源的论文,往往就无能为力了
专用大模型(比如秘塔):由于有专业数据库的支撑,因此能基本做到“靠谱”
“龙虾”类智能体:由于它可以自行拆解任务、大量搜索、广泛汇总,因此往往效果极佳(当然它也搜不到非开源论文,所以有些任务估计也不成)
(特别说明:OpenClaw是国内很多单位明令禁止的,但国产的“小龙虾”,如腾讯WorkBuddy等,是完全可以使用的,详情参见:《》 )
针对上述案例,王珏老师采用了DeepSeek、秘塔、腾讯WordBuddy三种方式进行了文献调研,结果发现:
秘塔最专业、最靠谱
WorkBuddy分析得最全面、结论最好
以下是具体的测试情况。
针对以上三种方式,我均输入了完全相同的提示词:
找到下文的原始出处,给出链接,写一篇简要文献综述: 《科学》杂志报导:哈佛团队追踪了三千多人后发现,每天久坐超8小时的人,晚上花20分钟做点中高强度运动——快走、慢跑、跳操都行——第二天体内的炎症因子水平,竟跟没久坐的人差不多
(一)WorkBuddy的表现(最佳)
经过WorkBuddy将近10分钟的工作,最后输出了一个doc文档:

它给出了基本结论是:
此表述为多处信息拼接与误传,无单一原始出处可对应,并给出了详细的表格分析(有哪些谬误)。
最后给出了当前研究的共识、以及相应的原始文献出处:

WorkBuddy的研究结论,真的是让人非常惊喜!
不过,在文档的最后所给出的的原始文献列表中,就出现了一些问题:

文中提供的4篇文献,其链接、简介均是正确的。尤其是论文3:Regulatory T cells shield muscle mitochondria from interferon-γ–mediated damage to promote the beneficial effects of exercise,是针对这一问题的最核心的文献,被WorkBuddy找到、并进行了准确地分析。
不过,有一点让我感到比较奇怪:在文献列表中居然多列出了2篇,正文中并未提及,而且链接也均有问题……
虽说如此,也可以说是瑕不掩瑜吧!毕竟,能够将一个说法剖析得如此细致、而且引用的研究成果基本靠谱,已经相当不容易了!
(三)秘塔AI的表现(次佳,不过更专业)
对于专业的文献研究,王珏老师一直向广大老师推荐“秘塔AI”,详见:
秘塔由于拥有比较全面的论文数据库,因此有能力在论文库中进行检索,因此往往检索得更权威、更靠谱。
以下是秘塔提供的基本结论:未找到原始研究、可能是误传或夸大:

然后,秘塔就将问题拆解为3个方面,分别进行了简要综述,并提供了相关的原始文献(所有pdf均可在线阅读、下载):

按照文献综述的规范,秘塔最后还提供了“现有研究的局限性与未来方向”。
可见,秘塔既有既有专业论文库的加持、搜索结果准确权威,而且其研究结论也具备了大模型的特质(强大的语义理解和提炼总结能力),是开展专业研究的出色好帮手!
相比WorkBuddy,秘塔找到的文献更加全面、关联性剖析更加专业,而且还直接提供了论文的pdf版本,更适合于专业研究。
——不过,WorkBuddy中所提供的最关键的“论文3”,在秘塔AI中却未提供出来。而且,我在秘塔中专门搜索了该论文的名称,秘塔中能找到的、而且也有论文的pdf版本(如下图):

也就是说:秘塔在拥有这篇关键论文的前提下,却没能准确地将其找出来!
而WorkBuddy,不仅搜到了最关键的论文(这说明WorkBuddy的语义理解能力比秘塔强),而且还紧扣我们的问题,提供了更符合我们关注点的解答,更加贴心!
(三)DeepSeek 4.0的表现(比前代表现好,但并非好的选择)
我把相同的提示词给了DS(目前是4.0 预览版,能力是相当强大的)
找到了9个网页、给出了链接,并指出了上述结论的谬误之处(如下图):

优点是:DeepSeek这回搜的大多都是期刊网站、或比较专业的研究报道网站,虽然大多并非原始论文,但相比前代大模型的表现,这已经很不错了!
不过,DeepSeek用来做文献调研,仍然不够专业:
相比WorkBuddy,DeepSeek仅指出了“误传”、“简化或数据混淆”,但没有指出该消息可能的多个来源,这一下效果就差了好久;
而相比秘塔,DeepSeek并不能提供论文的原文(即便它是开源论文),而且搜索到的论文质量,也不如秘塔。
另外,DeepSeek每次搜出的文章、以及给出的结论,往往相差很大——这就是它没有专业资料库所带来的必然问题。
【为何WorkBuddy效果会更好】
最后,王珏老师想说明一下,为何WorkBuddy干活的效果往往会更好,或者说更贴近我们的心意。
DeepSeek/秘塔 和 WorkBuddy的差别,本质上是“大模型”和“智能体”的差别。
对于大模型,大家已经很熟悉了——你给它一段提示词,它就会用它的“脑子”进行计算,输出一段带有“概率性”的文字。
大模型不会拆解你的问题(其实秘塔已经接近于智能体了),不会替你规划,不能输出大量的token(有上限)、更不能给你做excel或word.
因此,如果是针对复杂任务(需要拆解为若干步骤)、或需要输出大量文字的任务,或者涉及到读写本地文件的情况(如读写word文档),就需要交给类似WorkBuddy这样的“客户端版”的“智能体”——统称为“龙虾”类软件。
根据王珏老师的个人使用体验,只要你安装上了微信小龙虾,就不会再倒退回去了!因为,无论一件事情多么复杂,你只需要出思想、出方向、给要求,龙虾就会自动帮你做,而且质量往往相当高!
龙虾,就是装在我们电脑、手机上的能干的 “智能牛马”!一旦用上,就再也退不回去啦!
上一篇:今日立夏,发条微信迎接夏天
下一篇:微信最新公告!