百度ERNIE‑Image开源8B参数模型,消费级显卡实现顶级文生图效果
近期,AI文生图领域迎来重要突破:百度文心大模型正式发布并开源了ERNIE‑Image文生图模型。该模型以约80亿参数的轻量级规模,在多项国际权威评测中达到SOTA(当前最优水平),其参数量显著低于行业主流模型。
更值得关注的是,ERNIE‑Image仅需24GB显存的消费级显卡即可流畅运行。这标志着高质量图像生成的技术与硬件门槛被大幅降低,无论是个人创作者、设计师还是企业用户,现在都能便捷地体验顶尖的AI绘图能力。目前,用户已可通过文心一言App、百度千帆大模型平台等渠道直接体验该模型。

除了技术参数,实际性能更为关键。在SuperCLUE文生图权威榜单中,ERNIE‑Image综合得分位居国内第一、全球第四。排名其前的多为Nano Banana 2、Nano Banana Pro等商业闭源模型,而ERNIE‑Image已超越Qwen‑Image‑2.0‑Pro、Doubao‑Seedream‑5.0‑Lite等知名竞品。尤其在图文一致性与汉字生成两项核心指标上,该模型均取得国内榜首,展现出扎实的底层能力。

在国际公开评测中,ERNIE‑Image同样表现优异。在GenEval、OneIG(中英文)、LongText‑Bench等基准测试中,其综合性能领先于同类开源模型,整体上与Nano Banana等商业模型处于同一梯队。其中,在专门评估复杂指令理解与文本渲染能力的LongText‑Bench中,ERNIE‑Image以0.9733的高分位列全球开源模型第一。

“开源小钢炮”的技术底气
ERNIE‑Image被业界称为“开源小钢炮”。它采用单流Diffusion Transformer(DiT)架构,以约80亿的紧凑参数量,实现了高水准的图像生成效果。其核心能力主要体现在三方面:对复杂指令的精准理解与执行、高密度文本的清晰渲染,以及结构化图像的稳定生成。
模型支持中、英、日、韩等多语言输入,生成的汉字字形工整、笔画准确。这对于需要嵌入文字的设计场景,如海报、漫画、信息图等,提供了显著优势。在风格覆盖上,它涵盖了写实摄影、动漫插图、电影胶片、复古照片等多种类型,并在角色一致性、情绪表达方面表现突出。尤其在二次元漫画创作中,模型既能精准还原单一角色,也能稳定生成多角色场景,整体效果已接近专业画稿水准。
开源生态与行业反响
目前,ERNIE‑Image的模型权重与推理代码已在Hugging Face平台全面开源,遵循Apache 2.0协议,并支持ComfyUI工作流集成。已有海外开发者在社交媒体上分享测试结果,给出“ERNIE‑Image与Nano banana2对比效果令人惊艳”、“目前接触过的最佳开源文生图Turbo模型”等积极评价,显示出其在全球开发者社区中的初步认可。
行业应用落地进展迅速。最新信息显示,ERNIE‑Image已与同道大叔、电影网、凤凰网、蜻蜓FM、瑛麒动漫、吐司AI、RunningHub、Mulan AI等超过30家机构及20位设计师完成合作实测,生成的图片在效果稳定性与质量精度上均获得肯定。目前,已完成接入的创作平台、设计社区及知名企业数量已突破50家。
打破壁垒,推动普惠
总体而言,ERNIE‑Image的核心价值在于,以轻量化参数规模实现高性能生成,这直接打破了高端文生图能力对昂贵专业算力的长期依赖。此类技术路径,正有力推动开源生成式AI走向更广泛的普惠化应用。
对于设计、动漫、广告、新媒体等视觉创作密集型行业,这意味着一次高效率、低成本的创作工具升级。从更广阔的视野看,此类技术的成熟与普及,必将加速全民AI图像创作时代的全面到来。
游乐网为非赢利性网站,所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系youleyoucom@outlook.com。
同类文章
微软Copilot企业应用激增 关键技术进展与日活飙升解析
4月21日,微软AI Tour年度盛会在上海世博中心盛大举行。本次盛会汇聚了全球多个市场的创新实践,核心聚焦于一个关键议题:当企业迈入智能体时代,如何实现人工智能的规模化落地与深度转型?微软系统性地展示了近期的关键技术突破,覆盖从生产力工具、企业级平台到安全治理的全栈能力,为企业清晰地勾勒出一条从战
OpenAI Codex屏幕识别功能上线 开启智能交互新体验
4月21日,OpenAI为其桌面编程助手Codex带来了一项关键进化。继月初推出Mac版并引入记忆功能后,今天凌晨,一项名为Chronicle的新功能正式发布。简单来说,它让Codex具备了“看屏幕”的能力,从而大幅减少了用户每次提问时重复解释上下文的繁琐工作。 Chronicle的核心理念很直接:
Anthropic回应Claude Mythos模型遭未授权访问事件
就在Anthropic为其最新、也最具争议的AI模型Claude Mythos拉起严密警戒线的同时,一道意料之外的“侧门”被悄然打开了。 这款备受瞩目的AI模型自发布起便引发广泛关注。4月7日,Anthropic正式发布了Claude Mythos,并明确将其定位为一款“网络攻击专家”——其核心设计
寒武纪回应大厂自研AI芯片影响 强调产品具备广泛适用性
4月22日,寒武纪董事长兼总经理陈天石在年度业绩说明会上,针对当前互联网巨头加速布局自研AI芯片的行业现象,首次进行了系统性阐述与官方回应。 陈天石分析指出,互联网公司自研AI芯片的核心逻辑,通常是围绕其自身主营业务或特定的应用生态,打造高度定制化的软硬件一体解决方案。这本质上是一种垂直整合的商业模
西湖大学张驰团队提出新方法无需重训即可生成长视频
长期以来,AI视频生成技术最令人惊艳的成果,往往只停留在开头的几秒。人物表情生动,光影效果逼真,动作流畅自然,这很容易让人产生一种错觉:AI生成高质量视频似乎已经触手可及。 然而,随着技术探索的深入,一个根本性的挑战愈发清晰:真正的难点并非创造几秒钟的惊艳片段,而是如何将这种高质量稳定地延续到更长的
- 日榜
- 周榜
- 月榜
1
2
3
4
5
6
7
8
9
10
相关攻略
2015-03-10 11:25
2015-03-10 11:05
2021-08-04 13:30
2015-03-10 11:22
2015-03-10 12:39
2022-05-16 18:57
2025-05-23 13:43
2025-05-23 14:01
热门教程
- 游戏攻略
- 安卓教程
- 苹果教程
- 电脑教程
热门话题

