郑纬民院士领衔解读 Token 服务新趋势,趋境 ATaaS 平台重磅发布
3 月 27 日,作为 2026 中关村论坛核心组成部分,由趋境科技与九源智能计算系统生态联合体共同主办的“全栈智能全域推理:Token 爆发元年的全场景大规模推理服务”专题研讨会成功举办。论坛汇聚院士、顶尖学者及产业领军人物,聚焦大模型时代推理服务的核心技术、产业实践和生态协同,共探高效、稳定、安全、普惠的大模型推理服务体系建设。

免费影视、动漫、音乐、游戏、小说资源长期稳定更新! 👉 点此立即查看 👈
活动特邀九源智能计算生态联合体秘书长、清华大学教授、趋境科技首席科学家武永卫担任主持人。启元实验室副主任刘航、工业和信息化部电子工业标准化研究院副院长郭楠为活动致辞。中国工程院院士、九源智能计算系统生态联合体理事长、清华大学教授、趋境科技首席科学顾问郑纬民受邀出席并做主旨演讲,从宏观视角解读了从“模型服务”迈向“Token 服务”的底层逻辑与基础设施变革。趋境科技创始人兼 CEO 艾智远现场发布全新一代 AI 推理平台 —— 趋境 ATaaS 高效能 AI Token 生产服务平台(Approaching.AI Token as a Service),为破解算力投入与 Token 产出失衡难题提供了系统性解决方案。众多等产业链领军企业代表现场带来主旨演讲,分享 AI 推理服务产业的发展新路径。
郑纬民院士:AI 产业核心已从模型服务转向 Token 服务
在题为《从模型服务到 Token 服务》的主旨演讲中,郑纬民院士提出了一个清晰的产业趋势判断。他指出,随着智能体、AI 编程等应用的爆发式增长,业界对 Token 的消耗量正呈现百倍甚至千倍级的跃升,2026 年被称作“Token 爆发元年”可谓名副其实。这意味着,整个 AI 产业的核心关注点,已经悄然从过去的“模型参数有多庞大、模型是否可用”,全面转向了“如何稳定、低成本、高质量地交付 Token 产能”。

郑院士进一步强调:“未来的智能基础设施,必须围绕‘Token 即服务(TaaS)’的理念进行系统性重构。” 这其中的逻辑很清晰:传统模型服务的核心是保障模型的可得性与接口完整性,而 Token 服务的核心则是保障 Token 产能的可用性,它更关注成本、吞吐量、延迟与可靠性等生产性指标。这本身就是一个极端复杂的多维系统最优化命题,必须依赖全链路的系统性创新才能解决。
为此,郑纬民院士勾勒出支撑 TaaS 发展的三大核心技术底座:首先是全系统异构协同,关键在于将不同类型的计算任务,合理地分配到 GPU、CPU、内存乃至 SSD 之上,从而打破单一算力瓶颈;其次是存算协同,实现“以存换算”,例如通过前置 KV Cache 等技术,大幅削减重复计算量,直接提升推理效率;最后是面向服务等级目标(SLO)的智能调度,能够精准地将千变万化的业务需求,“翻译”为底层的资源决策指令。用郑院士的话来说:“只有当智能生成能力能够像水电一样被稳定调度与供给时,我们才能真正迎来算力制造 Token 为王的普惠智能时代。”
趋境 ATaaS 平台重磅发布,打造全球领先的 Token 生产效能放大器
论坛的重头戏,是趋境科技核心产品——趋境 ATaaS 高效能 AI Token 生产服务平台的正式发布。本次发布仪式阵容强大,由趋境科技创始人兼 CEO 艾智远,携手中国工程院院士郑纬民,以及并行科技董事长陈健、中科曙光智能计算产品事业部总经理杜夏威、华&为昇腾计算业务副总裁兼首席产品规划师叶耀荣、京东 Infra 产品负责人郝鹏、浦江实验室代表钟普共同揭晓。

那么,这个平台究竟要解决什么问题?答案直指行业痛点:当前大模型推理服务普遍面临硬件资源闲置、软件适配滞后、算力配置粗放、架构演进失衡这四大难题。其结果就是,巨额硬件投入难以高效转化为优质的 Token 产出,资源浪费与成本空耗现象突出。趋境 ATaaS 平台正是瞄准了这一困境,以高效能 Token 生产为核心目标,旨在支撑万级别的并发 AI 推理需求,实现日均万亿级别的 Token 整体产能。
为实现这一目标,该平台依托四大自研核心技术,构建了覆盖异构整合、智能调度到弹性扩容的全链路能力:
▪ 六合:异构推理 2.0:这项全球首创的大模型计算逻辑重构技术,能够深度融合 CPU+GPU、国产与非国产算力,实现任务的智能分流。其效果直观:可将万卡级智算集群的运营成本压降 20% 以上。
▪ 月饼:以存换算 2.0:作为全球首创的超体量 KV Cache 缓存技术,它将 KV Cache 存储空间扩展了百倍至千倍,最高可实现 90% 的缓存命中率。这意味着,高达 90% 的 GPU 算力开销可被直接削减。
▪ 双仪:虚实同构:这项全球首创的算子级 SLO 仿真技术,能实现算力资源的智能预规划与动态调优,精准切分异构算力资源。据称,可将万卡级智算集群的硬件综合资源利用率最高提升数倍。
▪ 万象:极致弹性:它打通了规模化量产的最后一公里,支持万亿参数大模型在 7 秒内快速拉起与动态配置变更,并能调度数百节点的超大规模执行实例(EP),为万卡级的高性能横向扩展提供了关键能力。
可以说,趋境 ATaaS 平台的发布,为 AI 基础设施的建设和运营提供了全新的思路与行业参考标准。它致力于让每一单位的算力和能耗投入,都能数倍转化为更稳定、更可衡量的 Token 价值产出。这标志着一个重要的转向:AI 基础设施的发展焦点,正从单纯的算力规模竞争,转向对 Token 生产效率的综合性衡量,推动整个算力基础设施从“数据中心”向真正的“Token 工厂”演进。

全产业链生态协同,凝聚国产算力发展核心共识
本次论坛不仅是前沿技术的展示台,更是产业生态协同的汇聚点。趋境科技积极推动与产业链上下游伙伴的深度合作,致力于构建一个开放共赢的智能计算生态。来自并行科技、九源智能计算系统生态联合体、中科曙光、京东云、阿里云、华&为、商汤科技等企业的代表,围绕国产算力多场景推理优化、Token 时代的 AI 引擎、算力底座高效推理等前沿话题,分享了与趋境科技的深度合作实践。
并行科技董事长陈健指出,其模型即服务(MaaS)业务得到了趋境科技的有力支持。双方合作将高质量 Token 的生产成本大幅优化,并在特定场景下将集群性能提升了 50%,共同服务于智谱、Kimi、MiniMax、DeepSeek 等头部大模型客户。
九源智能计算系统生态联合体副秘书长王豪杰则点明了国产算力的挑战:Token 时代的竞争转向单位成本产出,而国产卡却面临“生态驱动”困局。为此,九源联合体正打造国产智能计算生态,并在多款 GPU 适配、领域编程语言“九齿”、Mooncake 推理加速系统以及高效智能体等方面取得多项成果,推动国产算力从“可用”迈向“好用”。
京东云 AI Infra 产品负责人郝鹏透露,京东云已与趋境科技达成深度合作,联合打造下一代推理引擎,共同赋能 Mooncake 开源生态。华&为昇腾计算业务副总裁叶耀荣也表示,双方展开了全方位合作,在部分项目中于昇腾 AI 集群上实现了 2 倍以上的性能提升。此外,阿里云、商汤科技的代表也分享了在开源项目合作及为趋境 Token 服务提供高可靠算力支持等方面的实践。
在随后的圆桌对话环节,来自学术界与产业界的多位专家围绕“国产推理基础设施从‘可用’到‘好用’的路线选择与关键突破”展开了深入探讨。讨论凝聚了三大核心共识:其一,软硬件的深度协同是释放国产算力潜能的关键,必须通过系统级优化来弥合硬件性能与业务需求之间的鸿沟;其二,生态统一与标准建设至关重要,只有打破“百花齐放”带来的适配难题,才能实现真正的规模化应用;其三,人才培养是产业根基,需要通过开源社区、技术竞赛等方式,培育兼具深厚理论与工程实践能力的 AI 基础设施人才。

本次研讨会的成功举办,恰逢 AI 产业从模型竞争转向规模化应用、从 MaaS 转向 TaaS 的关键节点。它不仅为 AI 推理服务领域搭建了一个产学研用深度交流的高端平台,更为整个 AI 产业的高质量发展谋划了切实可行的路径。论坛同期宣布 2026 年春季启元人工智能大赛正式启动,旨在通过赛教融合的方式,为国产智能计算生态培育新一代人才,持续推动 AI 产业的开源创新与规模化应用进程。
游乐网为非赢利性网站,所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系youleyoucom@outlook.com。
同类文章
从个人站长时代到 AI 生产力:贝锐 20 周年的远程连接“进化史”
今年,国产远程连接 SaaS 服务商贝锐迎来了成立 20 周年。20 年时间里,这不仅是一家企业的成长历程,也在某种程度上映照出中国互联网连接方式的持续演进。从拨号上网、个人站长兴起,到移动互联网普及、远程办公加速,再到产业数字化不断深入,直到今天 AI 开始走向实际生产力,技术环境一直在变化,但有
2026AWE 探展:有没有能吸 30cm 头发不缠的吸尘器?第三代全链路自清洁出炉
探展2026AWE:当30厘米长发遇见第三代免打理吸尘器 今年的AWE(中国家电及消费电子博览会)现场,清洁家电展区热度不减。一个有趣的现象是,无论是长发飘飘的女士,还是家有“毛孩子”的宠主,大家最关心的技术问题竟高度重合:“到底有没有吸尘器,能一口气吸走30厘米的长头发,还完全不缠绕的?” 答案是
2026 年 GEO 优化公司用户口碑实证:多家技术型服务商真实效果对比推荐
2026年:生成式引擎优化行业的“规范元年” 进入2026年,生成式引擎优化(GEO)行业的发展轨迹,已然清晰。如果说前几年是反赌的规模扩张期,那么现在,整个行业正集体转向一个更扎实的阶段:规范发展。道理很简单,当人工智能从技术概念深度融入商业决策的核心环节,企业对在AI环境下的品牌可见性需求,就不
停止喂养那只“吃钱巨兽”!2026 年,你的跨境社媒矩阵该学会自己“印钞”了
一、账本真相:你养的究竟是“团队”,还是一头“成本巨兽”? 打开2026年的出海财务报表,不少企业家会倒吸一口凉气:名为“社媒运营”的那一栏,不知何时已演变成吞噬利润的黑洞。组建一支像样的专业团队,每月固定人力成本轻松突破十万大关,这还仅仅是水面之上的部分。水面之下,高昂的培训投入、管理内耗以及人员
十万悬赏守护安全!网易 UU 远程上线赏金计划,免费无广初心不变
【导语】一场高达十万元的“悬赏令”,能否为远程控制工具的安全防线带来革命? 最近,远程工具圈被一则消息刷屏:网易旗下的UU远程控制,正式启动了名为“赏金猎人”的计划,最高单项赏金十万元,公开征集安全漏洞与产品建议。要知道,当下不少远程工具正忙于商业化变&现,广告弹窗层出不穷。而UU远程在这次动作中,
- 日榜
- 周榜
- 月榜
1
2
3
4
5
6
7
8
9
10
相关攻略
2015-03-10 11:25
2015-03-10 11:05
2021-08-04 13:30
2015-03-10 11:22
2015-03-10 12:39
2022-05-16 18:57
2025-05-23 13:43
2025-05-23 14:01
热门教程
- 游戏攻略
- 安卓教程
- 苹果教程
- 电脑教程
热门话题

