财新传媒 财新传媒

阅读:0
听报道

导读:

     在 21 世纪的前四分之一的时间,人工智能(AI)以前所未有的深度和广度渗透到科研的各个领域,催生了一场新的科研范式革命。尤其是在过去两年,人工智能开始展现出思考、规划、执行、反馈、迭代甚至提出新假设的“智能体”特征。

 然而,这场革命将如何展开?其底层技术驱动力为何?它又将如何重塑维系科学共同体百年之久的协作与评价体系?

 在2025年年末,来自北京大学、上海交通大学、北京科学智能研究院和深势科技的四位学者,系统性地梳理了人工智能的技术脉络,指出其作为科研智能体,将重塑科学研究的内涵、边界与价值,自主人工智能科学家将成为一种具备全面视角和独特洞察力的科研伙伴,与人类科学家协同,共同探索知识的无人区。

张与之 陈思衡 张林峰 鄂维南|撰文

从“点式突破”到“整合与涌现” 

人工智能在科学领域的应用经历了一个从专用工具到通用智能体、从解决特定子任务到尝试优化研究流程的演进过程。这一过程大致可以2024年为界,划分为两个既有联系又具鲜明特征的阶段。这一年,诺贝尔化学奖与物理学奖双双授予了人工智能赋能的科学研究方向,标志着AI for Science已成为人类知识前沿的殿堂级成就。

继2012年深度学习在 ImageNet 上崭露头角之后,2016年AlphaGo 的胜利进一步向社会与科学界展现了深度学习与强化学习的惊人效果,也在一定程度上带动了科学家使用AI进行科学探索的尝试。在此后的 8 年间,“AI for Science”深刻改变了多个学科的研究面貌,其核心特征是利用AI模型对于复杂高维问题的表示与处理能力,在一些科学问题上实现了精度与效率远超传统方法的突破。

在结构生物学方面,AlphaFold2 解决了困扰生物学界半个世纪的难题[1],它利用创新的注意力网络机制,以前所未有的准确度从氨基酸序列预测蛋白质的三维结构。在分子与材料模拟方面,以 DeePMD 为代表的方法将深度学习与分子动力学模拟相结合,极大地扩展了对材料与化学反应等微观过程的认知尺度[2]。在气象预测方面,盘古、GraphCast 等模型直接从海量的历史气象数据中学习大气演化的复杂规律,将全球中期天气预报的时效从数小时缩短至数秒[3-4]。在材料发现方面,GNoME通过图神经网络在大规模晶体空间中预测稳定结构[5],并与 A-Lab 等自动化实验平台联动,形成“模型—合成—验证”的闭环范式[6]。

这些突破离不开日渐成熟的科研数字基础设施的有力支撑。高质量、大规模、标准化的数据集是 AI 模型的“养料”。诸如蛋白质数据库Protein Data Bank、材料基因组计划中的 Materials Project 项目等公开数据库的建设与积累,为AI模型的训练提供了坚实的基础[7-8]。以TensorFlow、PyTorch 为代表的深度学习框架降低了 AI应用 的 门 槛 。 同 时 ,DeePMD-kit、AlphaFold2、ESM等项目纷纷开源,极大地促进了学术界的跟进研究与二次创新,形成了开放协作的良好生态[9-10]。容器化、弹性调度、分布式训练/推理与大规模流水线使科研团队能够以更低成本与工作量获得弹性扩展的算力支持。

如果说2024年之前AI在科研中扮演的是局部代理模型的话,那么2024年后的AI模型正在经历智能体化的关键转变。其核心特征是具备一定的自主性,能够理解复杂的科研目标,并像人类科学家一样进行分解、规划、执行与反思。

这一转变的实现,得益于一系列关键技术的成熟与融合。以 OpenAI 的 o1 系列、DeepSeek 的DeepSeek-R1等为代表的新一代大语言模型引发了这次技术浪潮,在逻辑推理、复杂任务分解、代码生成与自我反思纠错等能力上取得了显著进步。这也适用于科研场景,将一个模糊的科研目标分解为一系列可执行的步骤(文献调研、理论建模、计算筛选、实验设计)。

科学研究的数据本质上是多模态的。GPT-4o等模型展示了对文本、图像、音频的流畅理解与生成能力;AlphaFold3将预测能力从单一的蛋白质拓展至包含蛋白质、核酸、小分子配体、离子和修饰的整个生物分子复合物,实现了对生命系统相互作用的更加全面的建模;Uni-3DAR尝试以自回归方法统一分子、蛋白、晶体等3D任务[11]。

科研活动天然是多角色、多任务协作的过程。MCP(Model Context Protocol)等开放协议的提出,旨在标准化模型接入外部数据源和工具的方式,极大地降低了AI在真实科研场景中调用数据库、操作模拟软件,甚至连接实验仪器的技术门槛。以AutoGen、LangGraph、Google ADK、Camel等为代表的开源多智能体框架,允许开发者方便地构建由多个专门工具与智能体组成的协作系统。

现代科学是高度分化的,每个子领域都有自己独特的模拟软件、数据格式和实验仪器,它们往往互不联通,形成了一个个“数据孤岛”和“工具壁垒”。一个打破当前困境的例子是玻尔(Bohrium)科研空间站[12],其通过整合智能化的学术知识引擎科学导航、云原生的算力调度系统勒贝格及标准化的实验室操作系统Uni-Lab-OS,允许科研工作者调用与共享海量的科学模型、数据集和标准化的计算与实验流程,这在相当程度上民主化了前沿科研工具的使用权。

综合所述,我们可以对“科研智能体”(或称“人工智能科学家”)给出一个初步的定义:一个能够围绕科学目标,能够在多模态知识/数据条件下进行推理决策,并通过标准化接口自主或协作地能执行科研任务、在反馈中自我优化的人工智能系统。其核心能力如图1所示,包括感知与理解(文本、图像、序列等多模态)、推理与决策(假设生成、因果推断、路线规划)、执行与操作(数据库/仿真/实验等工具与设备)、反馈与优化(结果比对、参数更新、计划重排)。

目前,全球范围内已经涌现出一些科研智能体及其驱动的智能实验室的例子,如能够实现自主编程实现人工智能算法的ML-Master智能体[13],能够灵活调用各类科研工具的SciMaster智能体[14],能够自主设计、执行并分析化学实验的ChemCrow智能体等[15]。这些遍布全球、横跨多元学科的探索实践共同汇成一个清晰的信号:科研智能体正迅速从前沿概念转变为解决科学研究问题的实用化力量。

图1

最后,需要指出的是,作为一个需要与数字世界、物理世界进行海量、高频、长时交互的主体,科研智能体的崛起本身,就对底层的科研基础设施提出了系统性的工程挑战,包括异构工具的调用、资源灵活扩容、服务部署与运维、数据与流程的溯源与复现、长程任务规划执行与长期记忆管理等。

同样重要的是,如何满足用户与开发者的双方激励,推动价值创造本身变得可持续,这离不开平台的接口调用、交易支付及推荐系统的工程能力。在开发者的构建下,技术在快速演化,并逐步汇聚于以玻尔(Bohrium)科研空间站为代表的新一代“AI for Science”基础设施上。这些集托管、协同、部署于一体的科研平台为上层的科研智能体提供一个稳定、丰富且可交互的行动环境,推动科研智能体走向规模化实践。

重塑科学图景

科研智能体的崛起,会从如下方面重塑科学研究的内涵、边界与价值(如图2所示)。

图2

一是,对科学研究方法论的改变:加速“归纳—演绎”循环。在传统科研模式中,这个“归纳—演绎”的循环过程往往周期漫长、耗时费力。一个科学家可能需要花费数月甚至数年时间来完成“收集数据→提炼规律→建立理论→推导预测→实验验证→修正理论”这一完整闭环。人工智能对科研范式最本质的改变,正是在于将这个低频、低速的“归纳—演绎”循环,转变为一个高频、自动化的科学探索引擎。这个由AI驱动的高速循环,不仅极大地压缩了科学发现的时间尺度,更有可能探索到人类科学家因认知局限或精力有限而无法触及的“未知大陆”。

二是,对科学研究协作界限的消融。科研智能体正在打破传统科学研究中的各种协作壁垒。从学科内部融合来看,以材料科学为例,长期存在“计算材料学”与“实验材料学”之间的壁垒。前者长于理论预测,但常与实验脱节;后者立足经验与试错,效率有限。人工智能、物理建模与高性能计算的结合使材料计算方法更加高效与准确;自动化与高通量实验与表征技术的发展也提升了实验验证的效率与一致性。在此基础上,科研智能体可以扮演将计算材料学与实验材料更高效黏合起来的智能指挥官的角色,通过理解高通量计算的预测结果,自主设计下一步的关键实验,将指令下达给自动化实验平台,并从返回的海量实验数据中学习和优化,以此推动形成一个高效迭代的材料学新范式。同样在生物学中,传统的湿实验(Wet Lab)与生物信息学代表的干实验(DryLab)也在AI的驱动下加速融合。

从跨学科的深度交融来看,当不同学科的知识、数据和工具都能被AI以统一的方式理解和调用时,跨学科的门槛将被大大降低。一个为药物研发设计的智能体,可能需要同时调用化学、生物学、临床医学乃至物理学的模型与数据。这种“跨界”能力将催生出更多交叉学科的创新,解决单一学科难以应对的复杂系统性问题,如气候变化、新发传染病等。

三是,对科学研究价值创造链条的重塑。社会之所以支持科学研究,是基于一个根本的价值逻辑:科学家的自由探索拓展人类知识边界,知识的拓展带来技术创新,最终回馈社会。然而,在现实的科研评价体系中,这个理想的链条常被“短路”。由于原始创新本身是小概率事件,难以直接衡量,“论文”在很大程度上异化为衡量科研成果和科学家贡献的主要(甚至是唯一)指标。这种以论文为中心的评价体系,正面临着严峻的挑战。比如,有研究指出20世纪70年代高被引论文中约15%具有颠覆性,而21世纪10年代这一比例降至5%以下[16];人工智能领域《NeurIPS》期刊接收论文数从 2015 年到 2023 年激增 8 倍,但相同条件下单篇平均引用数却大幅缩水。科研智能体的发展,有望帮助科研回归其本质——以拓展认知边界和解决实际问题为本源的科研初心。

科研智能体将缩短从“原始创新”到“价值创造”的链路。在传统模式下,一项基础研究成果可能需要经历数年乃至数十年的漫长周期,才能转化为实际应用。科研智能体通过“设计—验证—优化”的快速闭环,能够极大地缩短这一过程。这将催生出新的科研组织形式。例如,由少数顶尖人才与强大AI系统组成的“超级个体”或“微型科研公司”,他们能够独立完成从提出概念到创造出原型产品或解决方案的全过程,实现科研与产业的无缝对接。

科研智能体有望加速解决人类面临的重大挑战。在如此迅速发展的技术浪潮中,我们有理由期待在一些关键领域取得突破性进展。在生命健康领域,AI 有望加速个性化疫苗的研发、攻克复杂疾病的治愈难题;在物质科学领域,它可以帮助我们发现更经济的“碳捕获”技术,设计出更高效的能源利用方式。

科研智能体会推动论文从“评判机制”还原为“传播渠道”。当一个科研智能体能够直接输出一个经过验证的新材料配方、一种高效的催化剂合成路径或是一个可运行的优化算法时,其价值是直接且可衡量的。成果本身将成为评价的核心。正如没有人因为爱因斯坦的广义相对论发表在哪本期刊上而改变对其的评价,人们记住的是广义相对论本身。科研智能体产出的“硬核”成果,将淡化期刊影响因子等间接指标的光环,让科学传播回归其交流与启发的本意。

科研智能体可能也会引入新的智力成果的评价与激励模式。工作成果的基本单元逐步从静态的论文转变为动态的、可执行的智能体工具或服务。这些工具和服务通过高频的相互调用,形成一个实时流动的价值网络:一个高效、好用的工具接口能以极低成本服务于海量需求,其价值被即时放大;反之,冗余或低效的工具则会在开放竞争中被迅速边缘化,快速凋零代谢。智力成果与在实际科研网络中被调用的频次和创造的效用直接挂钩,评价和激励将变得更加实时、客观和精准。

迈向规模化的科学发现与技术突破 

总体来看,科研智能体正经历着从面向特定任务的助手到面向整体目标的自主高效实现的转变。驱动这一转型的根本力量,既来自生产力层面的跃升(算力、大模型与自动化技术的融合),也源于生产关系的演进(开协议与平台生态的不断成熟)。

基于当前的技术发展轨迹,我们对未来 1~5年科研智能体的演化路径作出如下展望。

未来 1~3 年,将是人机协作的时代。增强型大模型将蓬勃发展,它们在通用推理能力的基础上,深度融合特定学科的知识、数据和专用工具,解决领域专业问题的能力大幅提升。AI 将作为协作助(Copilot),无缝集成到现有的科研软件与工作流中,在信息检索、文献分析、代码编写、实验执行、报告写作等方面提供高质量的辅助。

科研智能体将成为每一位科研工作者手中可使用、可信任的日常工具,科研人员的生产力将得到提升,领先的科研机构将率先构建起一体化的科研智能体平台,实现知识和工具的沉淀与复用,代表性的成果将如雨后春笋般持续涌现。

未来3~5年,“自主人工智能科学家”(Autonomous AI Scientist)将大幅提升科学研究的上限。具备长期记忆、复杂多步推理和主动学习能力的智能体,将在无人或极少人为干预的情况下,卓越地完成对于即使站在当下的顶尖科学家而言,也面临根本性、可能重塑学科格局的重大问题。AI 驱动的高速进行“归纳—演绎”循环的范式将从少数顶尖实验室走向更广泛的应用。

自主人工智能科学家会成为一种具备全面视角和独特洞察力的科研伙伴,与人类科学家协同,共同探索知识的无人区。这最终会帮助整个社会规模化地产生可复现、可转化的科学与技术增量。当这一天到来时,我们不仅将拥有更强大的解决问题的能力,更将迎来对“科学”这一人类最伟大之一的事业的全新认知。
 

本文于2025年12月首发于《前沿科学》,原文标题为“技术成果不断涌现 科研智能体即将崛起”,《赛先生》获授权转载,略有修订。

作者简介:

张与之,深势科技资深算法研究员。

陈思衡,上海交通大学人工智能学院长聘教轨副教授。

张林峰,北京科学智能研究院理事长、深势科技创始人兼首席科学家。

鄂维南,中国科学院院士,北京大学数学科学学院讲席教授。

参考文献:

[1] JUMPER J,EVANS R,PRITZEL A,et al. Highly accurate protein structure prediction with AlphaFold[J]. Nature,2021,596(7873):583-589.

[2]  ZHANG L,HAN J,WANG H,et al. Deep potential molecular dynamics:a scalable model with the accuracy of quantum mechanics[J]. Physical review letters,2018,120(14):143001.

[3] BI K,XIE L,ZHANG H,et al. Accurate medium-range global weather forecasting with 3D neural networks[J]. Nature,2023,619(7970):533-538.

[4] LAM R,SANCHEZ-GONZALEZ A,WILLSON M,et al. Learning skillful medium-range global weather forecasting[J]. Science,2023,382(6677):1416-1421.

[5] MERCHANT A,BATZNER S,SCHOENHOLZ S,et al. Scaling deep learning for materials discovery[J].Nature,2023,624(7990):80-85.

[6] SZYMANSKI N J,RENDY B,FEI Y,et al. An autonomous laboratory for the accelerated synthesis of novel materials[J]. Nature,2023,624(7990):86-91.

[7] BERMAN H M,WESTBROOK J,FENG Z,et al. The protein data bank[J]. Nucleic acids research,2000,28(1):235-242.

[8] JAIN A,ONG S P,HAUTIER G,et al. The materials project:a materials genome approach to accelerating materials innovation[J]. APL materials,2013,1(1):011002.

[9] WANG H,ZHANG L,HAN J,et al. DeePMD-kit:a deep learning package for many-body potential energy representation and molecular dynamics[J].Computer physics communications,2018,228:178-184.

[10] LIN Z,AKIN H,RAO R,et al. Evolutionary-scale prediction of atomic-level protein structure with a language model[J]. Science,2023,379(6637):1123-1130.

[11] LU S,LIN H,YAO L,et al. Uni-3DAR:unified 3D generation and understanding via autoregression on compressed spatial tokens [EB/OL].(2025-03-21)[2025-09-07]. https://arxiv.org/abs/2503.16278.

[12] LIU Z,TANG S,YE R,et al. ML-Master:towards AI-for-AI via integration of exploration and Reasoning [EB/OL]. (2025-06-19)[2025-09-07]. https://arxiv.org/abs/2506.16499.

[13] CHAI J,TANG S,YE R,et al. SciMaster:towards general-purpose scientific AI agents,part I.X-Master as foundation[EB/OL].(2025-07-08)[2025-09-07]. https://arxiv.org/abs/2507.05241.

[14] BRAN A M,COX S,SCHILTER O,et al. Augmenting large language models with chemistry tools[J].Nature machine intelligence,2024,6(5):525-535.

[15] BOIKO D A,SANTOS-MARTINS D,BROWN J R,et al. Autonomous chemical research with a large language model[J]. Nature,2023,624(7992):570-578.

[16] PARK M,LEAHEY E,FUNK R J. Papers and patents are becoming less disruptive over time[J]. Nature,2023,613(7942):138-144.

话题:



0

推荐

赛先生

赛先生

243篇文章 4分钟前更新

饶毅、鲁白、谢宇三位学者主编的《赛先生》 ── 与科学同行,关注科学与文化。关注请加微信号:iscientists

文章