首页
AI
苹果发布40万张图像的Pico-Banana数据集,助力AI图片编辑模型训练

苹果发布40万张图像的Pico-Banana数据集,助力AI图片编辑模型训练

热心网友
转载
2025-10-31

10月29日,苹果公司正式推出名为Pico-Banana-400K的大规模研究数据集,其中包含40万张经过处理的图像样本。值得注意的是,该数据集的构建过程采用了谷歌最新发布的Gemini 2.5模型作为核心技术支撑。

据悉,这项研究成果以《Pico-Banana-400K:面向文本引导图像编辑的大规模数据集》为题发布,同时苹果还公开了基于该研究生成的完整图像资源。该数据集采用非商业研究许可协议发布,意味着学术机构与研究团队可自由使用其中的数据资源,但禁止将其应用于商业场景。

数月前,谷歌推出的Gemini 2.5-Flash-Image模型(内部代号Nanon-Banana)在图像编辑任务中表现卓越,被业界视为当前最先进的视觉内容处理工具之一。尽管近年来各类生成式模型在图像处理领域进步显著,但苹果研究团队指出:"虽然技术持续革新,开放研究仍受限于缺乏大规模、高质量且可自由共享的图像编辑数据集。现有数据集往往依赖专有模型生成的合成数据,或仅包含有限的人工筛选样本。此外,这些数据普遍存在领域偏移、编辑类型分布不均以及质量控制不一致等问题,严重制约了高质量图像编辑模型的研发进程。"

为突破这一瓶颈,苹果团队着手构建更具全面性与代表性的图像编辑数据集。

Pico-Banana-400K的构建流程

研究团队首先从OpenImages数据集中筛选了大量真实照片,确保样本涵盖人物肖像、实体物体及含文字场景等多样化内容。

苹果发布Pico-Banana-400K数据集:含40万张图像,帮助训练AI图像编辑模型

随后,团队设计了35种不同类型的图像修改指令,并将其归类为八大编辑类别,具体包括:

像素与光度调整:如添加胶片颗粒质感或复古滤镜效果;

以人为中心的编辑:例如将人物形象转化为Funko Pop风格的玩具造型;

场景构图与多主体编辑:如改变天气条件(晴天/雨天/雪天);

对象级语义修改:如移动物体位置或调整空间关系;

图像缩放处理:如局部画面放大等操作。

接下来,研究人员会将原始图像连同编辑指令输入至Nanon-Banana模型执行图像编辑。生成结果随后交由Gemini 2.5-Pro模型进行自动化评估,判断其是否准确遵循指令并具备良好的视觉质量。只有通过双重验证的结果才会被纳入最终数据集。

苹果发布Pico-Banana-400K数据集:含40万张图像,帮助训练AI图像编辑模型

Pico-Banana-400K不仅包含单轮编辑(即通过单次提示完成修改)的样本,还涵盖多轮连续编辑序列,以及"偏好对比"样本——即成功与失败的编辑结果对比,帮助模型学习区分理想与不良输出。

尽管研究团队承认Nanon-Banana在精细空间控制、布局推理和文字排版处理方面仍存在局限,但他们强调,Pico-Banana-400K的核心目标是为下一代文本引导图像编辑模型提供坚实、可复现的训练与评测基础。

目前,相关研究论文已发表于预印本平台arXiv,完整的Pico-Banana-400K数据集也在GitHub上面向全球研究者免费开放。

来源:https://www.ithome.com/0/893/148.htm

免责声明

游乐网为非赢利性网站,所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系youleyoucom@outlook.com。

同类文章

中际旭创稳居AI光模块预期,易中天赛道另两家现疲态

人工智能基础设施建设的核心领域光模块行业,近期因“易中天”组合(新易盛、中际旭创、天孚通信)的三季度财报发布引发市场剧烈波动。尽管三家企业均受益于AI算力建设浪潮实现同比业绩增长,但环比数据分化导致

2025-10-31.

自然堂双11十亿补贴来袭,自研科技赋能国货美妆新体验

当消费者在双11期间愈发关注产品品质与核心成分,不再为品牌溢价买单时,国货美妆领军品牌自然堂凭借其深厚的科研积淀,打破了“高效必高价”的行业惯性。今年双11,自然堂不仅推出多重优惠活动,更以“科技赋

2025-10-31.

华为RAS技术驱动智算升级:重塑高可靠数据中心未来

随着AI大模型技术的迅猛发展,全球数据中心正加速向智能化算力时代迈进。从ChatGPT到各类智能应用,算力需求呈现爆发式增长态势,单机柜功率密度从传统15kW跃升至50kW甚至200kW,这对数据中

2025-10-31.

谷歌AI转型实战:传统业务与AI融合的成功范本与启示

谷歌母公司Alphabet近日公布的第三季度财报引发市场关注。数据显示,公司当季总营收达1023 46亿美元,同比增长16%,超出华尔街预期逾20亿美元。每股摊薄收益2 87美元同样优于市场预期,推

2025-10-31.

紫光股份2025三季报:算力连接双驱动,业绩市场齐增长

紫光股份近日发布的财务报告显示,公司在“算力×联接”战略驱动下,前三季度业绩实现跨越式增长,营业收入达773 22亿元,同比增幅31 41%。核心子公司新华三成为主要增长引擎,其营业收入突破596

2025-10-31.

热门教程

更多
  • 游戏攻略
  • 安卓教程
  • 苹果教程
  • 电脑教程

最新下载

更多
29天游戏
29天游戏 角色扮演 2025-10-31更新
查看
说谎公主与盲眼王子汉化
说谎公主与盲眼王子汉化 角色扮演 2025-10-31更新
查看
电影院模拟器无限金币
电影院模拟器无限金币 模拟经营 2025-10-31更新
查看
房产达人汉化
房产达人汉化 角色扮演 2025-10-31更新
查看
电影院模拟器
电影院模拟器 模拟经营 2025-10-31更新
查看
包裹递送模拟器3D
包裹递送模拟器3D 模拟经营 2025-10-31更新
查看
包裹递送模拟器3D无限金币
包裹递送模拟器3D无限金币 模拟经营 2025-10-31更新
查看
房产达人汉化
房产达人汉化 角色扮演 2025-10-31更新
查看
车祸物理模拟器
车祸物理模拟器 休闲益智 2025-10-31更新
查看
房产达人汉化
房产达人汉化 角色扮演 2025-10-31更新
查看