AI大模型如何加速科学发现与科研创新

数码系统

相机 win10

测评 win11

手机智车

华为 Tesla

小米理想

苹果蔚来

游戏软件

LOL 抖音

原神微信

当前位置：首页

AI大模型如何加速科学发现与科研创新

热心网友时间：2026-05-16

转载

大模型深入行业：从95%的准入门槛到科学新范式的探索

在生产环节中，95% 是一个分水岭。

以人类的表现作为参照，人工操作的准确率通常在 92% 到 98% 之间浮动。因此，行业为机器设定的容忍度判别标准，往往取其中位数。任何低于 95% 的准确率，无论是 80% 还是 90%，对于那些对生成结果容忍度极低的关键生产环节来说，本质上并无区别——都意味着尚未达标。

回顾过去几年，以计算机视觉、语音识别为代表的 AI 技术取得了令人瞩目的成就。然而，模型可解释性差、通用性不强等固有弊端，始终像一道无形的壁垒，阻碍着 AI 技术的大规模普及与应用。

转机出现在大模型技术崛起之后。这类模型通过与人类的持续交互进行学习，从而获得解决复杂问题的更强能力。在这个过程中，沉淀于各行业的“Know-How”（专业知识）在内容生成中扮演了关键角色，正在对医学、金融、安全、法律等领域产生变革性的影响。

在近期的一场科技论坛上，来自学术界与工业界的顶尖科学家们展开对话，聚焦于科学前沿探索与技术应用落地。一个清晰的共识是：大模型深入行业，与具体领域结合，在激发生产力的同时，也必将对原有的生产链条带来碘伏性影响。这种重塑将从底层逻辑开始，逐渐向上蔓延，最终波及技术研发、产品开发乃至服务消费的每一个环节。

越来越多的研究者开始意识到，大模型为科学规律的发现和“AI for Science”的发展提供了前所未有的便捷工具。甚至有学者预测，未来十年内，生成式 AI 将重新定义科学研究的范式。

那么，大模型的出现究竟对“AI for Science”意味着什么？又将为其发展带来哪些实质性的推动与挑战？

能力越大，责任越大

“知识增强型”行业大模型已成为业界共识。它被视为更接近人类大脑、能够释放智能生产力的 AI 落地范式。其核心在于，将深厚的行业领域知识注入模型，提升模型对专业知识的记忆与推理能力，从而有效弥合通用基础模型与具体应用场景之间的认知鸿沟。

然而，理想丰满，现实骨感。在实际操作中，从业者往往会遭遇意想不到的复杂性。

以医疗领域为例，一家技术服务商分享了他们的观察：从服务医疗机构（B端）的角度，医疗大模型的应用可划分为诊前、诊中、诊后三个阶段。每个阶段需要解决的问题不同，对模型训练的要求也极高。

比如在诊前环节，传统模式下医生需要花费大量时间与患者沟通，收集病史信息以做出初步判断。这项工作耗时耗力。引入大模型后，这部分工作有望由 AI 辅助完成。医生可以向模型输入医疗数据和个人知识体系，让模型学习医生的思维习惯，从而提前与患者进行高效的病理信息沟通。

但一个棘手的难题随之浮现：医疗场景对深层语义理解的要求极高。患者在描述病情时，很少使用具有明确指征性的专业医学术语。症状与病理之间的对应关系，需要医生凭借经验进行判断。当这项任务交给模型时，它能否准确地将患者口语化的描述与复杂的医学问题对齐，并做出正确推断？这对构建可信赖的医疗大模型而言，是一个巨大的挑战。

医学的复杂性，决定了其与大模型等 AI 技术的结合之路，必然是学界与工业界共同关注的焦点。

在论坛的对话中，来自学术界的专家与腾讯天衍实验室的负责人，分别从理论与实践的视角，探讨了如何应对这一挑战。为了解决医疗大模型的“专业度”与可信问题，一种思路是将海量、结构化的专业医学知识整合进模型。例如，覆盖数百万医学实体和上千万医学关系的知识库，可以为模型提供推理时的参考依据。当患者提问时，模型能自动提取问题中的关键疾病、药品等实体，并从知识库中调取相关信息，从而做出更精准的问答。

这种对专业知识的深度整合，不仅提升了模型本身的可靠性，也为更广泛的科学问题提供了新思路。例如，通过预训练大模型技术构建通用框架，可以有效计算病毒蛋白质对人体的亲和力，从而预测哪些病毒突变可能增强其感染性，这对流行病学研究与防控具有重要意义。

随着大模型深入更多具体场景，其影响力与责任边界也在同步拓宽。在网络安全领域，威胁已呈全球化态势。如何防范 AI 技术本身可能带来的安全风险，甚至被攻击者利用？安全专家指出，大模型的出现改变了游戏规则。过去，安全系统需要“投喂”海量攻击数据进行训练。而现在，借助大模型的技术加持，安全人员只需进行少量调整，模型就能理解指令并执行。通过调用外部工具并分析结果，模型可以自主判断后续步骤，从而更智能地完成任务。

能力越强大，能改变的领域就越多，所肩负的责任自然也越重。AI 提升了复杂推理与决策能力后，能够在数据标注有限的情况下，通过持续交互与试错来优化自身策略。这种能力若应用于网络安全防御，将给整个行业带来效率的跃升。

由此可见，以通用大模型为基座，结合垂直行业知识构建专业模型，正成为大模型落地最清晰的路径之一。

新科学，新范式

“AI for Science”的概念自提出以来，便致力于解决传统科研范式下的诸多难题，让 AI 技术成为科学家手中的强大工具。

最具代表性的案例莫过于 AlphaFold2。在其开源后仅一周，就成功预测了 98.5% 的人类蛋白质结构。而在此之前，全球顶尖科学家们数十年的努力，也只覆盖了人类蛋白质序列中 17% 的氨基酸残基。如今，大模型与大型数据库的结合，正以前所未有的效率处理海量数据、整合碎片化知识。

回望科学史，自十五、十六世纪以来，科学发现主要沿着两条路径展开：一是基于第一性原理，探索物理世界的基本理论；二是以数据驱动的方式，对观测现象进行归纳总结。

受量子力学建立的影响，第一条路径的探索已触及一定瓶颈，许多基础理论框架已然建立。但在真实、复杂的应用场景中，量子计算虽潜力巨大，其成熟周期依然漫长。正如学者在对话中指出的，生成式 AI（AIGC）将对量子科研乃至更广泛的科学领域产生深远影响。然而，学界与工业界的关注点存在天然差异：学界追求在实验室条件下将事情做到极致，而工业界则更关注研究的可落地性、商业价值与规模化潜力。例如，在实验室验证某个量子算法比经典算法更快，本身具有很高的学术价值，但距离真正的产业应用，可能还有很长的路要走。

而在数据驱动的第二条路径上，挑战同样存在。小规模数据往往只能支撑粗颗粒度的模拟与预测。要提升算法模型的能力，离不开更大规模、更高质量的数据支撑。

数据的重要性不言而喻，但高质量、经过系统梳理的数据，尤其是中文数据，在国内仍属稀缺资源。此外，随着数据量级爆炸式增长，单纯依赖传统的数据处理方式，不仅计算代价激增，分析效果的边际收益也会递减。

以多媒体通信为例，传统应用中的数字化信息数据量庞大，对存储、带宽和算力提出了极高要求，很难完全通过堆砌硬件来满足。因此，基于脑电信号等生理信息的智能通信成为热门研究方向。通过对大脑感知与信息处理机制的理解，研究者希望探索出更智能、高效的数据处理与传输方法。

与传统通信场景不同，在资源受限、环境复杂的广域场景下，通信需求会受到诸多干扰。已有的工作经验，可以为制定特定场景下的数据压缩与传输标准提供宝贵参考。在某些极端受限的场景中，高效的压缩传输技术正扮演着越来越关键的角色。未来，结合视频编码与语义通信，有望在特定场景下更好地保护关键语义信息，从而实现通信智能化与效率的双重提升。

当下，大模型对技术变革与生产力解放的积极意义已经显现。它的影响不局限于物理世界，更延伸至对生物世界的探索与理解。有科研人员指出，目前 AI 研究使用的许多数据，仍基于旧范式产生。通过调整大模型参数以适应具体任务，并借助提示词（Prompt）工程重新收集数据，可以获得更适配大模型发展的新数据。

可以设想，在不远的将来，或许会出现一个吸收了海量科学训练数据的“科学大模型”。它不仅能理解现有科学知识，甚至可能构建新的假设，催生新的科学发现，从而反哺并推动“AI for Science”进入一个全新的发展阶段。

仰望星空，脚踏实地

一项技术能否被冠以“变革”之名，关键不在于它在实验室里有多精妙，而在于它的触角能否延伸至各行各业，解决具体、真实的问题，在应用场景中激活其生命力。这对于大模型在“AI for Science”领域的发展而言，尤为重要。

新药研发的历程就是一个典型例证。过去，这曾是一条漫长而昂贵的道路。有分析显示，制药巨头平均每款新药的研发成本高达数十亿美元，从研发到上市往往超过十年。而 AI 的介入，正在改变这一局面。它不仅能提升临床试验的效率与数据准确性，还能进行更清晰的病理分析，从而大幅加速新药的诞生过程。

专家预测，针对蛋白质进行药物设计及疾病诊疗，将是未来 AI 应用落地创新的重要方向。这既需要科研人员保持对前沿技术的热情——“仰望星空”，也需要工业界的力量共同参与——“脚踏实地”，实现技术与产业的紧密对接。

科学研究的两大根本目的，始终是对事物本质的探索，以及对实际问题的解决。秉持这一理念，多家领先的科技实验室正围绕医疗、AI、多媒体、安全、量子等前沿领域，与顶级高校及研究机构展开合作，共同探索底层技术创新与落地应用的可能性。

具体到应用层面，成果已经初显。例如，面向医疗场景推出的大模型，已具备文案生成、智能问答、病历结构化、影像报告辅助、辅助诊断等多种能力，能够嵌入到诊疗全流程中，提升医生效率并改善患者随访体验。在“AI for Science”领域，相关研究团队也在国际顶级竞赛中取得了突破性成绩，例如在催化剂设计、蛋白质-蛋白质相互作用预测等方面，将预测速度或整体效果提升了数个量级。

每个行业都有其独特的难题，细分场景之多难以穷尽。长期以来，提供通用算法和模型的 AI 公司，往往难以洞悉每个垂直行业的特殊需求。为此，在量子计算等前沿领域，布局已不仅限于算法和软件研究，更延伸到通过与化学、材料、制药、金融等行业的深度合作，构建从经典算法、AI 工具、软件开发到云平台 SaaS 服务的完整链条，加速技术在实际工业场景中的落地。

这种产学研的结合颇具价值。产业界的优势在于能基于海量场景，识别出最具价值的应用问题，并将其转化为可计算的算法需求；而学术界则能以此为导向，努力提升底层技术的性能。双方在近期与远期目标上协同，才能真正推动像量子计算这样的前沿技术逐步“用起来”。

仰望星空，不忘脚踏实地。如今，以大模型为代表的新一代 AI 技术，正深入生物科学、医学、量子计算、安全、多媒体等研究腹地。这不仅仅是一场关于技术应用的竞赛，更是对科学范式变革的一次关键性探索。

经过数月的快速发展，尽管人们尚未完全弄清大模型在何种条件下会实现能力的“涌现”，例如究竟需要多少参数或何种结构，但积极的相互作用已经出现。大模型研究不仅为解决复杂问题、提高计算效率提供了强大工具，更为探索“AI for Science”的未来发展，提供了系统性的借鉴思路。未来已来，这场由技术驱动的科学范式变革，正悄然拉开序幕。

来源:https://www.leiphone.com/category/ai/151RIJU3KKs8gord.html

上一篇：周志华当选IJCAI理事会主席引领人工智能国际发展

下一篇： Falcon 180B开源模型将如何改变行业竞争格局