2分钟完成论文调研!ByteDance Research推出论文检索智能体PaSa,远超主流检索工具


2025年被誉为agent元年,字节跳动研究团队率先推出了一款基于强化学习的论文检索智能体——pasa。它能够模拟人类研究人员的行为,高效地完成搜索引擎查询、论文阅读和参考文献查找等任务,将原本耗时冗长的文献调研过程压缩至短短两分钟。

☞☞☞AI 智能聊天, 问答助手, AI 智能搜索, 免费无限量使用 DeepSeek R1 模型☜☜☜

图片

您是否曾为寻找特定主题的论文而苦恼?或者对某个研究方向充满兴趣,却难以确定是否存在类似研究?PaSa为科研人员提供了一个强大的学术助手,只需输入研究问题,PaSa即可自动调用搜索引擎,浏览相关论文并追踪引用网络,快速、精准地呈现所有相关文献。

PaSa效果展示:

图片

图片

图片

对比实验表明,PaSa显著优于现有主流检索工具,包括Google、Google Scholar等。例如,PaSa-7b在Recall@20和Recall@50指标上分别比Google提升了37.78%和39.90%。

PaSa现已开放试用,并已公开所有数据、代码和模型:

图片

  • 论文地址:https://www.php.cn/link/5eea6fd7b02448c35fd405cfe823d128
  • 项目仓库:https://www.php.cn/link/fec82acb7f6b4e8672bda38f9a7ddad3
  • PaSa主页:https://www.php.cn/link/c0b3cb0842f9f8148f618c587b48d5ba

PaSa Agent架构

PaSa的核心由两个大型语言模型Agent构成:Crawler和Selector。Crawler负责自主调用搜索工具、阅读论文和扩展参考文献,收集与用户查询相关的论文;Selector则负责精读Crawler找到的论文,判断其是否满足用户需求。

图片

PaSa框架:Crawler旨在最大化相关论文的召回率,Selector则注重精确性,确保论文符合用户需求。

PaSa处理用户查询的工作流程:

Health AI健康云开放平台 Health AI健康云开放平台

专注于健康医疗垂直领域的AI技术开放平台

Health AI健康云开放平台 113 查看详情 Health AI健康云开放平台

图片

PaSa工作流示例:Crawler可生成多种互补的搜索词进行多次搜索,并评估其行为的长期价值。

训练与优化

PaSa的训练基于高质量的学术细粒度查询数据集AutoScholarQuery,该数据集包含36k条数据,每条数据包含一个AI领域的学术问题及其相关论文列表。

图片

AutoScholarQuery数据示例

为了解决强化学习训练中的奖励稀疏性和过长行动轨迹问题,研究团队引入了Selector作为辅助奖励模型,并提出了一种新的session-level PPO算法。Selector通过模仿学习进行训练,生成决策Token判断论文是否符合用户需求,并输出决策依据。

实验结果

研究团队在AutoScholarQuery-test和RealScholarQuery两个数据集上,对PaSa与一系列基线模型进行了全面对比。结果显示,PaSa在召回率和准确率上均显著优于其他模型,尤其是在RealScholarQuery数据集上,提升更为明显。

图片

总结

PaSa是一个强大的基于大型语言模型的论文检索智能体,它通过模拟人类的文献调研过程,高效地解决了学术搜索中的挑战,为科研人员提供了极大的便利。

以上就是2分钟完成论文调研!ByteDance Research推出论文检索智能体PaSa,远超主流检索工具的详细内容,更多请关注其它相关文章!


# pasa  # git  # ai  # 2025年  # 产业  # 关键词优化排名步骤  # 房山外贸建设网站  # 如何建设论坛网站  # 房地产营销推广计划季度  # 美国网站推广现状分析  # 石首网站关键词建设  # 人工智能网站建设流程  # 东莞seo项目优化公司  # seo和sem通俗易懂  # 移动端网站的优化  # 出了  # 是在  # 今日  # 是一个  # 祝福语  # 科研人员  # 内测  # 生命科学  # 多家  # 一言  # 2025 


相关栏目: 【 Google疑问12 】 【 Facebook疑问10 】 【 优化推广96088 】 【 技术知识133117 】 【 IDC资讯59369 】 【 网络运营7196 】 【 IT资讯61894


相关推荐: 史玉柱谈AI:国内最缺是计算数学人才,曾给浙大数学系捐五千万  高通发布长期产品计划,为工业和企业物联网产品提供全新组合方案  小米首次曝光 64 亿参数的 MiLM-6B AI 大模型,或将应用于小爱同学  传Meta 2025年推出首款AR眼镜,采用军用级别材料,计划生产1000台  云鲸发布全新的扫拖机器人J4系列  NTU、上海AI Lab整理300+论文:基于Transformer的视觉分割最新综述出炉  猿力科技入选北京市通用人工智能产业创新伙伴计划  Meta 人工智能业务落后竞争对手,研究人员大量离职成重要原因  科技赋能司法执行 阿里资产免费为全国法院升级VR新服务  贫穷让我预训练  AI 冥想应用 Ogimi.ai 推出,可为用户提供教练级个性化指导  大型无人机FH-98国内首次夜航转场成功  微软为 AI 初学者推出免费网课:为期 12 周,共 24 节课  中美陷入囚徒困境,人工智能变得不可控?可参考核不扩散条约规范  自然语言生成在智能家居设备中的应用  江永:精准施训提升通信无人机应急救援能力  机器人 展才能  ChatGPT 可以设计机器人吗?  元宇宙技术带你穿梭“大运河”,江苏书展上的数字阅读馆吸睛小读者  OpenAI 已全面开放 GPT-3.5 Turbo、DALL-E 及 Whisper API  人工智能在重症监护室的未来  OpenAI 向所有付费 API 用户开放 GPT-4  图像生成过程中遭「截胡」:稳定扩散的失败案例受四大因素影响  世界人工智能大会(WAIC 2025)点燃魔都,博尔捷数字科技携前沿技术产品亮相  AI 模型 Stable Diffusion 升级:正常生成五指、图像更逼真  《爱康未来之夜嘉宾官宣,携手共赴AI未来》  微软宣布为 Azure AI 添加男性声线,增强文本转语音功能  售价14.99万起!小米汽车部分信息疑遭AI曝光,内部人士回应:网传图片明显经过处理,不可轻信  基于预训练模型的金融事件分析及应用  SnapFusion技术大幅提升AI图像生成速度  遵义市首次引入手术机器人,成功实施全膝关节置换术  360发布数字安全和人工智能的强大结合:360安全大模型  专家解读国家网信办深度合成服务算法备案信息公告:不等于百度、阿里、腾讯等生成式AI产品获批  掌阅科技申请阅爱聊商标 掌阅科技申请AI相关商标  兆讯传媒率先全面拥抱AI 数智广告内容焕发新生机  五个IntelliJ IDEA插件,高效编写代码  当人工智能开始写高考作文?作家陈崇正、朱山坡谈文学与未来  视觉中国推出AI灵感绘图功能  Meta开源文本生成音乐大模型,我们用《七里香》歌词试了下  郭帆:AI发展日新月异,或是弯道超车好莱坞的最好机会  腾讯TRS之元学习与跨域推荐的工业实战  GPT-4成功战胜AI-Guardian审核系统:谷歌研究团队的人工智能抵抗人工智能  业内领先 四川大学华西第四医院甲状腺乳腺外科成功进入手术机器人时代  深剖Apple Vision Pro中暗藏的“AI”  苹果推出全新沉浸式 AR 体验应用“Deep Field”  麦肯锡:到 2045 年左右,将有 50% 工作被 AI 接管  花16000元买四款扫拖机器人!科沃斯追觅石头小米谁能笑到最后?  标贝科技亮相国际顶会ICASSP2025 加速布局海外AI数据市场  国内AI大模型“安卓时刻”到来!阿里云通义千问免费、开源、可商用  五项人工智能尚未能够实现的任务 

 2025-01-23

了解您产品搜索量及市场趋势,制定营销计划

同行竞争及网站分析保障您的广告效果

点击免费数据支持

提交您的需求,1小时内享受我们的专业解答。

运城市盐湖区信雨科技有限公司


运城市盐湖区信雨科技有限公司

运城市盐湖区信雨科技有限公司是一家深耕海外推广领域十年的专业服务商,作为谷歌推广与Facebook广告全球合作伙伴,聚焦外贸企业出海痛点,以数字化营销为核心,提供一站式海外营销解决方案。公司凭借十年行业沉淀与平台官方资源加持,打破传统外贸获客壁垒,助力企业高效开拓全球市场,成为中小企业出海的可靠合作伙伴。

 8156699

 13765294890

 8156699@qq.com

Notice

We and selected third parties use cookies or similar technologies for technical purposes and, with your consent, for other purposes as specified in the cookie policy.
You can consent to the use of such technologies by closing this notice, by interacting with any link or button outside of this notice or by continuing to browse otherwise.