当前位置: 首页
科技数码
苹果联合打造RubiCap框架:让AI精准描述图像每个细节

苹果联合打造RubiCap框架:让AI精准描述图像每个细节

热心网友 时间:2026-03-26
转载

IT之家 3 月 26 日消息,科技媒体 9to5Mac 昨日(3 月 25 日)发布博文,报道称苹果公司携手威斯康星大学麦迪逊分校,联合发布名为 RubiCap 的全新 AI 训练框架,主要用于优化“密集图像描述”模型的训练流程。

免费影视、动漫、音乐、游戏、小说资源长期稳定更新! 👉 点此立即查看 👈

IT之家注:密集图像描述(Dense Image Captioning)是一种先进的计算机视觉技术。与只给出一句整体描述不同,该技术能识别图片中的各个局部区域(如“桌子上的红苹果”、“远处的行人”),并为每个细节生成精准的文字说明。


这项技术在训练视觉语言模型、文本生成图像以及改善无障碍工具等领域具有核心价值。研究人员指出,传统的训练方法面临着人工标注成本过高的问题;而利用现有大模型生成合成数据的替代方案,则容易导致模型输出缺乏多样性且泛化能力较弱。

苹果研究团队为了攻克上述难题,创新设计全新强化学习机制。系统首先从数据集中抽取 5 万张图像,并调用 GPT-5、Gemini 2.5 Pro 等前沿大模型生成候选描述。


随后,系统利用 Gemini 2.5 Pro 分析候选内容,提炼共识与遗漏点,进而将其转化为清晰的评分标准。最后,由 Qwen2.5 模型担任“裁判”,根据这些标准对描述进行打分。这种机制为模型提供了结构化的精准反馈,让其明确知道该如何修正错误。

苹果基于这一框架,最终训练出了参数量分别为 20 亿、30 亿和 70 亿的三个 RubiCap 模型。测试数据显示,这些紧凑型模型展现出了惊人的效率,其中 70 亿参数模型在盲测中获得了最高的排名,并实现了最低的“幻觉”错误率,全面超越了参数量高达 720 亿的前沿大模型。



更值得一提的是,30 亿参数的微型模型在部分测试中甚至反超了 70 亿参数版本,进而充分证明,高质量的图像描述模型可以摆脱对庞大参数量的绝对依赖。

IT之家附上参考地址

来源:https://www.163.com/dy/article/KOUCLRMJ0511B8LM.html

游乐网为非赢利性网站,所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系youleyoucom@outlook.com。

同类文章
更多
2026年轻薄本电脑推荐 五款女生优选机型性能实测

2026年轻薄本电脑推荐 五款女生优选机型性能实测

2026年,笔记本电脑市场的演进方向已十分明确:AI功能正加速普及,而轻薄设计与强劲性能的融合已成为新常态。对于女性用户而言,选择一款2026年新款轻薄本,其考量早已超越了外观设计这一单一维度。如今,真正的决策核心在于便携性、性能表现、屏幕素质、AI应用适配、续航能力、接口扩展性以及整体使用体验的全

时间:2026-05-12 19:04
Steam Machine防黄牛排队预约机制正式上线

Steam Machine防黄牛排队预约机制正式上线

Steam手柄的首次发售可谓一波三折。产品几乎在开售瞬间就被抢购一空,但讽刺的是,大量货源并未流入真正玩家手中,而是被黄牛囤积炒卖。为了彻底解决黄牛抢购问题,Valve果断引入了预约排队购买机制。近期,随着新款Steam手柄上线这一机制,同一份Steam客户端更新中还透露出一个重要信号:即将面世的S

时间:2026-05-12 19:04
TCL 32X3A OLED显示器图赏 4K 240Hz双模面板与星际之门设计

TCL 32X3A OLED显示器图赏 4K 240Hz双模面板与星际之门设计

国内电竞显示器市场迎来了一位重磅玩家——TCL。作为其进军高端电竞领域的首款力作,定位旗舰的32X3A OLED+全能显示器可谓诚意满满。它不仅实现了显示技术的全面突破,更在工业设计与综合体验上精益求精,旨在满足高端电竞玩家与专业创作者对画质、性能与设计的极致追求。 目前,这款31 5英寸的OLED

时间:2026-05-12 19:04
毛里塔尼亚电信Chinguitel获5G牌照 开启高速网络运营

毛里塔尼亚电信Chinguitel获5G牌照 开启高速网络运营

5月12日,商务部发布一则重要行业动态:毛里塔尼亚主要电信运营商Chinguitel正式签署承诺文件,计划申请5G运营牌照。此举不仅标志着该国电信牌照体系的更新,更深层次地推动了毛里塔尼亚通信基础设施的整体升级与数字化转型进程的全面加速。 此次引入5G技术的目标十分清晰。部署5G网络将能够提供比现有

时间:2026-05-12 19:04
三星冰箱接入Gemini AI 升级食材识别与互动功能

三星冰箱接入Gemini AI 升级食材识别与互动功能

三星在美国市场为其Bespoke AI Family Hub智能冰箱系列推送了一次重大软件升级。本次更新深度整合了谷歌Gemini大模型,全面增强了AI视觉识别与自然语言交互能力,同时带来了更智能的Bixby助手和高度个性化的“即时简报”功能。这套系统已在韩国经过数月测试,现已正式面向美国用户开放。

时间:2026-05-12 18:32
热门专题
更多
刀塔传奇破解版无限钻石下载大全 刀塔传奇破解版无限钻石下载大全
洛克王国正式正版手游下载安装大全 洛克王国正式正版手游下载安装大全
思美人手游下载专区 思美人手游下载专区
好玩的阿拉德之怒游戏下载合集 好玩的阿拉德之怒游戏下载合集
不思议迷宫手游下载合集 不思议迷宫手游下载合集
百宝袋汉化组游戏最新合集 百宝袋汉化组游戏最新合集
jsk游戏合集30款游戏大全 jsk游戏合集30款游戏大全
宾果消消消原版下载大全 宾果消消消原版下载大全
  • 日榜
  • 周榜
  • 月榜
热门教程
更多
  • 游戏攻略
  • 安卓教程
  • 苹果教程
  • 电脑教程