华为袁远:建设数据语料库,应对中国数据大国的关键挑战
12月17日至18日,2025全球数据技术大会(GDTC)在北京召开,本届大会由下一代互联网国家工程中心主办,并与澳门科技大学联合承办。华为公司副总裁、数据存储产品线总裁袁远发表了题为《构建先进数据基础设施,激活AI时代数据价值》的主旨演讲。
免费影视、动漫、音乐、游戏、小说资源长期稳定更新! 👉 点此立即查看 👈
观察者网了解到,这是袁远首次以华为数据存储产品线总裁身份对外亮相,而该产品线前任总裁周跃峰已担任华为公司高级副总裁、华为云CEO。
袁远在演讲中指出,中国虽已成为全球数据大国,但在数据要素建设层面仍面临关键挑战:我国数据留存率仅为2.8%,需从技术层面解决海量数据“存不下”、存储成本高和能耗大等难题;行业高质量数据稀缺,以医疗模型为例,我国模型训练数据量仅有西方领先国家的10%左右;大量城市与企业数据仍储存在“孤岛”上,数据共享率不足25%;全球年度泄露数据已达惊人的471.6亿条,给各行业带来巨大风险,数据泄露已成为当前数据跨境流动的核心命题。

华为公司副总裁、数据存储产品线总裁袁远发表演讲
以下为袁远演讲全文:
各位嘉宾,大家好!今天大会的主题是“共建智能时代的新型数据基础设施”。我想借此机会,分享一下华为在数据基础设施方面的思考与实践,希望能为产业界推进高质量数据集建设、用好AI有所助益。
站在Agentic AI新时代,各行各业都在更加深度、全面地使用数据,使其成为AI训练与推理的“语料”与知识,进而创造价值。我们看到:用于AI的数据量同比增长41%;数据资源共享日益活跃,更多行业和技术企业选择进入数据市场,通过扩充数据资产的规模、精度与多样性,在智能化竞争中实现领先;高质量数据集建设提速,截至目前我国已建成超过500PB高质量数据集;AI的快速发展巩固数据要素价值地位的同时,更推动传统IT架构从“以算力为中心”向“以数据为中心”转变。
中国已是全球数据大国,但数据要素建设仍面临关键挑战:我国数据留存率仅为2.8%,需从技术层面解决海量数据“存不下”、存储成本高和能耗大等难题;行业高质量数据稀缺,以医疗模型为例,我国模型训练数据量仅有西方领先国家的10%左右;大量城市与企业数据仍储存在“孤岛”上,数据共享率不足25%;全球年度泄露数据已达惊人的471.6亿条,给各行业带来巨大风险,数据泄露已成为当前数据跨境流动的核心命题。
依据国家数据局《可信数据空间发展行动计划(2024—2028年)》的指引,应从城市、行业、企业等方面加快建设可信数据空间,释放数据要素价值。基于此,结合华为多年实践与理解,我们对数据基础设施的构建有以下建议。
首先,在城市层面,宜发挥城市枢纽作用,打造先进存力中心,推动公共数据和行业数据的汇聚、治理和可信流通,支撑城市数字经济发展。近年来,我们已与多地开展合作实践,比如:助力一些城市汇聚50PB公共数据,服务了超60家本地企业,发挥数据储备和流通价值;帮助部分城市构建高质量汽车行业数据集,支持智能网联汽车发展;并通过“聚数、治数、供数、用数”,打造了环京津数据要素产业园,有效带动地方经济增长。
其次,在行业层面,应建设数据共享协作平台,推动数据从分散利用到智能融合,让高质量行业知识库赋能生态。以某国家级育种实验室为例,我们帮助构建全国一体化育种数据基础设施,让数百PB跨域数据可管、可视、可流动,依托统一数据标准和一站式数据工具链,提升4倍数据标注和模型微调效率,打造智慧育种智能体,助力农业科研创新。
最后,在企业层面,企业作为最早开始重视、挖掘数据资产的先行者,我们需助力建设AI数据湖底座,加强全域数据共享、高效管理与敏捷使用。以自动驾驶为例,通过AI数据湖整合路测、仿真、高精地图等多类数据,提供百万车辆数据高速接入、EB级数据高效管理、全球站点数据跨域流动等关键能力,让环境感知、行人避让、语音助手等多种智能体协同,保障极端条件与特定场景下行驶安全。
先进数据基础设施建设需要持续的技术创新。未来,我们将加大投入,迭代、引领AI数据湖发展方向,助力更多城市、行业、企业逐步解决收数、存数、治数、用数问题。具体而言,一方面,我们将继续完善并开源开放端到端的AI工具集,丰富我国AI工具生态,我们相信只有基于实际可获得的工具打造的智能化能力,才是长期可持续的。另一方面,依托全局数据管理技术,我们将深入研究可信数据跨域流通过程中的合规治理、安全流转与跨境审计。同时,推动数据存储技术发展,降低向量、标量等新型数据存储范式的存储成本,持续释放数据要素价值。
面对AI所带来的深刻变革,我们将始终与各方携手共进,汇聚数据力量,共同加速我国AI落地。谢谢大家!
游乐网为非赢利性网站,所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系youleyoucom@outlook.com。
同类文章
领克GT概念跑车北京车展首发 百公里加速仅2秒
领克首款GT概念跑车亮相北京车展,由中欧团队联合打造。新车采用经典GT比例与低趴宽体设计,配备液态金属蓝涂装与2+2座舱,设有高性能模式按键可激活空气动力学套件。车辆采用后驱布局与AI智能运动控制系统,百公里加速约2秒,设计融合瑞典极简美学并参考全球用户反馈。
英伟达RTX 5070移动版GPU发布 12GB显存性能大幅提升
英伟达推出12GB显存版RTX5070移动GPU,与8GB版同步上市。两者均基于Blackwell架构,核心规格相同,仅显存容量不同。此举旨在缓解GDDR7芯片供应压力,为OEM提供灵活配置,加速笔记本产品布局,更大显存可更好满足游戏与AI应用需求。
微星新款雾面WOLED显示器MAG 276QRY28与276QRDY54正式发售
微星将于5月15日推出两款26 5英寸雾面WOLED显示器MAG276QRY28和276QRDY54,售价分别为2499元和6299元。均采用第四代WOLED面板,具备QHD分辨率、VESADisplayHDRTrueBlack500认证、1500尼特峰值亮度及99 5%DCI-P3色域覆盖。276QRY28刷新率为280Hz,高阶款276QRDY54支持4
中芯国际一季度净利润13.61亿元 同比增长0.4%
中芯国际2026年第一季度营收176 17亿元,同比增长8 1%;净利润13 61亿元,同比增长0 4%。公司预计第二季度收入环比增长14%至16%,毛利率指引上调至20%至22%。这反映出公司在行业复苏中展现出财务韧性,并通过运营优化增强了短期增长势头。
Google Cloud 持续优化 PostgreSQL 核心功能
谷歌云近期分享了其对PostgreSQL核心功能的贡献,重点涉及逻辑复制、升级流程与系统稳定性。更新包括逻辑复制的自动冲突检测、序列同步及订阅管理优化,提升了分布式架构可靠性。升级工具增强缩短了大型数据库升级时间,确保数据完整性。此外,修复了多项漏洞以增强系统稳健性,并预告了结构。
- 日榜
- 周榜
- 月榜
1
2
3
4
5
6
7
8
9
10
相关攻略
2015-03-10 11:25
2015-03-10 11:05
2021-08-04 13:30
2015-03-10 11:22
2015-03-10 12:39
2022-05-16 18:57
2025-05-23 13:43
2025-05-23 14:01
热门教程
- 游戏攻略
- 安卓教程
- 苹果教程
- 电脑教程
热门话题

