当前位置: 首页
AI
苹果发布40万张图像的Pico-Banana数据集,助力AI图片编辑模型训练

苹果发布40万张图像的Pico-Banana数据集,助力AI图片编辑模型训练

热心网友 时间:2025-10-31
转载

10月29日,苹果公司正式推出名为Pico-Banana-400K的大规模研究数据集,其中包含40万张经过处理的图像样本。值得注意的是,该数据集的构建过程采用了谷歌最新发布的Gemini 2.5模型作为核心技术支撑。

免费影视、动漫、音乐、游戏、小说资源长期稳定更新! 👉 点此立即查看 👈

据悉,这项研究成果以《Pico-Banana-400K:面向文本引导图像编辑的大规模数据集》为题发布,同时苹果还公开了基于该研究生成的完整图像资源。该数据集采用非商业研究许可协议发布,意味着学术机构与研究团队可自由使用其中的数据资源,但禁止将其应用于商业场景。

数月前,谷歌推出的Gemini 2.5-Flash-Image模型(内部代号Nanon-Banana)在图像编辑任务中表现卓越,被业界视为当前最先进的视觉内容处理工具之一。尽管近年来各类生成式模型在图像处理领域进步显著,但苹果研究团队指出:"虽然技术持续革新,开放研究仍受限于缺乏大规模、高质量且可自由共享的图像编辑数据集。现有数据集往往依赖专有模型生成的合成数据,或仅包含有限的人工筛选样本。此外,这些数据普遍存在领域偏移、编辑类型分布不均以及质量控制不一致等问题,严重制约了高质量图像编辑模型的研发进程。"

为突破这一瓶颈,苹果团队着手构建更具全面性与代表性的图像编辑数据集。

Pico-Banana-400K的构建流程

研究团队首先从OpenImages数据集中筛选了大量真实照片,确保样本涵盖人物肖像、实体物体及含文字场景等多样化内容。

苹果发布Pico-Banana-400K数据集:含40万张图像,帮助训练AI图像编辑模型

随后,团队设计了35种不同类型的图像修改指令,并将其归类为八大编辑类别,具体包括:

像素与光度调整:如添加胶片颗粒质感或复古滤镜效果;

以人为中心的编辑:例如将人物形象转化为Funko Pop风格的玩具造型;

场景构图与多主体编辑:如改变天气条件(晴天/雨天/雪天);

对象级语义修改:如移动物体位置或调整空间关系;

图像缩放处理:如局部画面放大等操作。

接下来,研究人员会将原始图像连同编辑指令输入至Nanon-Banana模型执行图像编辑。生成结果随后交由Gemini 2.5-Pro模型进行自动化评估,判断其是否准确遵循指令并具备良好的视觉质量。只有通过双重验证的结果才会被纳入最终数据集。

苹果发布Pico-Banana-400K数据集:含40万张图像,帮助训练AI图像编辑模型

Pico-Banana-400K不仅包含单轮编辑(即通过单次提示完成修改)的样本,还涵盖多轮连续编辑序列,以及"偏好对比"样本——即成功与失败的编辑结果对比,帮助模型学习区分理想与不良输出。

尽管研究团队承认Nanon-Banana在精细空间控制、布局推理和文字排版处理方面仍存在局限,但他们强调,Pico-Banana-400K的核心目标是为下一代文本引导图像编辑模型提供坚实、可复现的训练与评测基础。

目前,相关研究论文已发表于预印本平台arXiv,完整的Pico-Banana-400K数据集也在GitHub上面向全球研究者免费开放。

来源:https://www.ithome.com/0/893/148.htm

游乐网为非赢利性网站,所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系youleyoucom@outlook.com。

同类文章
更多
ATaaS平台发布:如何构建日产能万亿的Token工厂

ATaaS平台发布:如何构建日产能万亿的Token工厂

3月27日,作为2026中关村论坛核心组成部分,由趋境科技与九源智能计算系统生态联合体共同主办的“全栈智能 全域推理:Token爆发元年的全场景大规模推理服务”专题研讨会成功举办。论坛汇聚院士、顶尖

时间:2026-03-28 22:52
海㡳AI开源新突破!甲子光年解析产业未来

海㡳AI开源新突破!甲子光年解析产业未来

从模型到基础设施,再到社区,开源在海淀意味着什么?作者|周悦编辑|王博“你心目中的AI社区是什么样的?”当主持人提出这一话题,来自AI公司的创业者、开发者、投资人、媒体人、AGI Bar老板,甚至一

时间:2026-03-28 22:46
华为AI深度布局:如何引领科技变革新格局

华为AI深度布局:如何引领科技变革新格局

新智元报道编辑:艾伦【新智元导读】华为诺亚方舟实验室主任王云鹤官宣离职。我们梳理了王云鹤的经历。王云鹤今日在朋友圈官宣,将辞去华为诺亚方舟实验室主任职位,告别华为。从 2025 年 3 月到今天,王

时间:2026-03-28 18:52
Claude限流,Altman紧急叫停Sora:AI竞争格局改变

Claude限流,Altman紧急叫停Sora:AI竞争格局改变

新智元报道编辑:元宇【新智元导读】Sora应用关停,Claude却因太火而被限流:一个烧不起,一个供不上,算力墙面前,AI竞赛的胜负手突然变了。一夜之间,打工人突然发现:Claude开始限流了。An

时间:2026-03-28 18:46
谷歌内存论文疑被抄袭,华人学者控诉业内学术不公

谷歌内存论文疑被抄袭,华人学者控诉业内学术不公

新智元报道编辑:好困 Aeneas【新智元导读】把闪存股一夜干崩的谷歌顶会论文,出大事了。TurboQuant的核心方法,两年前就被一位华人学者做完、发完顶会、代码全部开源了。谷歌不仅没正面提及,而

时间:2026-03-28 16:58
热门专题
更多
刀塔传奇破解版无限钻石下载大全 刀塔传奇破解版无限钻石下载大全
洛克王国正式正版手游下载安装大全 洛克王国正式正版手游下载安装大全
思美人手游下载专区 思美人手游下载专区
好玩的阿拉德之怒游戏下载合集 好玩的阿拉德之怒游戏下载合集
不思议迷宫手游下载合集 不思议迷宫手游下载合集
百宝袋汉化组游戏最新合集 百宝袋汉化组游戏最新合集
jsk游戏合集30款游戏大全 jsk游戏合集30款游戏大全
宾果消消消原版下载大全 宾果消消消原版下载大全
  • 日榜
  • 周榜
  • 月榜
热门教程
更多
  • 游戏攻略
  • 安卓教程
  • 苹果教程
  • 电脑教程