当前位置: 首页
AI
苹果自研AI模型Manzano亮相,多模态能力媲美GPT-4o

苹果自研AI模型Manzano亮相,多模态能力媲美GPT-4o

热心网友 时间:2025-09-29
转载

据最新消息,苹果公司正秘密研发代号为"Manzano"的新型图像AI模型。这一创新技术将突破性地实现图像识别与生成的双重能力,标志着苹果在人工智能领域的重要布局。

免费影视、动漫、音乐、游戏、小说资源长期稳定更新! 👉 点此立即查看 👈

目前该项目仍处于研发阶段,仅有一份主要由华人学者参与的预研论文披露(包括已转投Meta的研究员庞若鸣)。论文中展示了部分概念验证图像,分辨率虽低但能处理复杂指令场景。

苹果探索自研多模态

苹果技术团队坦言,这种双重能力的融合一直是业内技术瓶颈,导致多数开源模型在整体性能上逊色于OpenAI和Google的商业化产品。

内部测试数据显示,Manzano的表现已与GPT-4o、Gemini 2.5等业界标杆旗鼓相当,甚至在某些场景下超越DeepSeek Janus Pro等专业模型。

苹果探索自研多模态

研究人员发现,现有AI模型普遍存在"偏科"现象:专精分析的模型生成能力弱,擅长创作的模型理解能力差。特别在处理含大量文字的图像(如文档、图表)时表现欠佳。其症结在于传统架构难以同时优化连续型理解和离散型生成两种处理模式。

Manzano创新性地采用混合分词方案:共享编码器可同步输出用于理解的浮点标记和用于生成的分类标记。这种同源异构设计大幅降低了任务冲突概率。

苹果探索自研多模态

系统采用三层架构:混合分词器+统一语言模型+独立图像解码器。解码器研发了9亿/17.5亿/35.2亿参数三个版本,最高支持4K级图像处理。

训练过程分为三阶段,累计消耗23亿图文数据集和10亿文图数据集,处理标记量达1.6万亿。部分训练素材来自DALL-E3和ShareGPT-4o生成的合成数据。

性能测试显示,300亿参数版本在ScienceQA等专业评测中表现亮眼,图表解析能力尤为突出。模型呈现明显的规模效应,大版本在部分任务中领先小版本超过10个百分点。

苹果探索自研多模态

在垂直领域对比测试中,Manzano与专用系统的差距控制在5%以内。图像生成方面同样表现出色,可完成风格转换、景深模拟等高阶创意任务。

虽然Manzano展示了模块化设计的优势,为多模态AI发展提供了新思路,但苹果整体AI实力仍与头部企业存在差距。即使推出新框架,iOS 26仍计划集成GPT-5。这套自主技术能否真正改变苹果的AI战略,还需时间检验。

来源:https://www.ithome.com/0/886/285.htm

游乐网为非赢利性网站,所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系youleyoucom@outlook.com。

同类文章
更多
小米物流大件“当日达”服务上线 50 城

小米物流大件“当日达”服务上线 50 城

小米物流大家电“当日达”实现全国50城覆盖,上午11点前下单最快当日送达 对于大家电配送时效长的普遍困扰,小米物流带来了全新的解决方案。最新消息显示,小米旗下大件商品的“当日达”服务范围已成功拓展至全国50座重点城市。除了北京、上海、广州、深圳、杭州、成都等一线与新一线核心城市外,此次升级还囊括了天

时间:2026-04-06 11:57
为什么现在很多人觉得 OpenClaw 不好用

为什么现在很多人觉得 OpenClaw 不好用

当前开源版本的定位 你得明白,当前的开源版本,本质上更偏向于一个**开发者工具链**,而非一个即开即用的完整产品。它的核心组件非常明确: 一个基于 Node js 的运行环境 (runtime) 一个网关 (gateway) 插件与技能 (plugins skills) JSON 配置文件 命令

时间:2026-04-06 11:02
WorkBuddy工具

WorkBuddy工具

好的,我已准备好作为您专属的 SEO 内容优化专家开始工作。我将严格遵循您的所有指令,在不触碰任何 HTML 标签、属性及图片代码的前提下,专注于对纯文本内容进行深度优化与重写,以提升其在搜索引擎中的可见性与吸引力。 我的核心工作流程是:首先,我会精准解析您提供的原始文章,确保核心事实与信息结构毫发

时间:2026-04-06 08:34
OpenClaw 3.31 审批问题总结

OpenClaw 3.31 审批问题总结

OpenClaw 3 31 强制审批问题解析 最近将 OpenClaw 升级到 3 31 版本后,许多用户反馈,执行每一条命令都需要手动点击“批准”,操作体验变得阻滞不畅。这并非系统故障或未知漏洞,而是官方在后台更新并默认启用了一套更为严格的“零信任”安全框架。简单来说,其核心逻辑是默认不信任任何操

时间:2026-04-06 07:02
一篇讲透:豆包、元宝、DeepSeek、Kimi、WorkBuddy,职场里到底怎么分工

一篇讲透:豆包、元宝、DeepSeek、Kimi、WorkBuddy,职场里到底怎么分工

别再把所有 AI 当成一个东西:WorkBuddy 和豆包、元宝、DeepSeek、Kimi,到底该怎么选? 这一年,AI 的进化速度着实叫人眼花缭乱。 大家的关注点,早就从“这工具能写文章吗”跳到了“它能不能帮我做方案、改稿子、整理会议纪要,甚至把任务往前推一步”。 于是,一个新问题浮出水面。 很

时间:2026-04-05 18:33
热门专题
更多
刀塔传奇破解版无限钻石下载大全 刀塔传奇破解版无限钻石下载大全
洛克王国正式正版手游下载安装大全 洛克王国正式正版手游下载安装大全
思美人手游下载专区 思美人手游下载专区
好玩的阿拉德之怒游戏下载合集 好玩的阿拉德之怒游戏下载合集
不思议迷宫手游下载合集 不思议迷宫手游下载合集
百宝袋汉化组游戏最新合集 百宝袋汉化组游戏最新合集
jsk游戏合集30款游戏大全 jsk游戏合集30款游戏大全
宾果消消消原版下载大全 宾果消消消原版下载大全
  • 日榜
  • 周榜
  • 月榜
热门教程
更多
  • 游戏攻略
  • 安卓教程
  • 苹果教程
  • 电脑教程