当前位置: 首页
AI教程
谷歌Gemini 2.0三大新功能详解与体验评测

谷歌Gemini 2.0三大新功能详解与体验评测

热心网友 时间:2026-05-25
转载

最近,Google的动作可谓一波接一波。

给人的感觉是,趁着OpenAI的“存粮”似乎告一段落,Google正以惊人的频率向外推送更新。就在昨晚,他们又发布了一项关于Gemini的新功能——虽然这项功能实际上在周日就已上线,但官方推文直到深夜才姗姗来迟。

说的就是它。

这项新功能的核心在于“个性化”。它能根据你过往所有的Google搜索记录,让模型更深入地理解你的偏好,从而在搜索时提供更具针对性的答案。

这仅仅是上周更新潮中的一环。再往前看,上周五,Google升级了其“深度研究”(Deep Research)功能。这次升级的关键在于将底层模型换成了Gemini 2.0 Flash Thinking。与之前的1.5 Pro相比,新基座的能力显著提升,并且支持高达100万token的上下文长度。

时间再倒回上周四,几乎引爆全网的Gemini 2.0原生多模态功能,已经被用户们玩出了各种新花样。

更不用说同样在上周开源的Gemma 3,这个仅270亿参数的“小模型”,在多项基准测试中表现甚至超越了DeepSeek v3、o3-mini等对手。

Google这一周的动作,密集得有些超乎寻常。但每一个更新都分量十足,其内容足以让OpenAI开一场20分钟的发布会来专门介绍。

在深度体验了几天之后,一个清晰的感受是:Gemini 2.0系列可能被市场低估了。经过这轮更新,它已经成为我日常使用频率仅次于ChatGPT的AI对话产品。

原因很简单:综合体验与生态整合。

三大新功能深度解析

接下来,我们逐一拆解这三大核心更新。

1. 原生多模态:AI绘图的新范式

首先是上周四推出的“用嘴改图”功能,这堪称AI图像编辑的一种新范式。其强大之处无需过多赘述,直接看几个有趣的案例便知。

例如,通过自然语言指令一键去除图片水印。

或者,为一幅图中的人物一键更换服装。

在社交平台X上,还有一个非常有趣的案例:用户为自己拍摄的照片直接替换了背景。其指令大致是:“你已经上班迟到了,却还没离开家……于是你拍了一张健身照,然后对Gemini 2.0 Flash Experimental说:展示这位女士在N线14街站台的一张自拍照,她竖起大拇指,背景中有一群沮丧的MTA工作人员正在维修轨道。头顶的LED屏幕显示日期:2025年3月13日。”

效果看起来相当实用。这个功能目前可以在Google AI Studio体验。

2. 深度研究(Deep Research):免费的研究利器

第二个重磅更新是“深度研究”功能。这里需要先表明一个态度:OpenAI的Deep Research和o1 pro,是我至今仍愿意为其支付每月200美元高昂订阅费的核心原因。一旦你体验过深度研究,很可能会被其产出所震撼。

以金融行业为例,与许多行业研究员和科研朋友交流后,他们普遍的反馈是:即使作为经验丰富的老手,要完成一份同等质量的研究报告,自己也至少需要投入10个小时以上。

但很多人可能不知道,“深度研究”这个功能概念,其实是Google在去年12月率先提出的。

不过,当时的底层模型是Gemini 1.5 Pro,其效果确实不尽如人意。随后,OpenAI在2月份基于o3模型微调出了自己的版本,并将效果提升到了新高度,也让“深度研究”这个概念真正进入了大众视野。后来,Perplexity和Grok 3等产品也推出了类似功能,但大多名为“深度搜索”(Deep Search),本质上是增强的AI搜索,与具备完整规划、拆解、合成能力的“深度研究”仍有区别。

深度研究本质上是一个智能体(Agent)产品。用户提出问题后,它会像真正的助手一样,先拆解目标、制定规划,然后进行搜索、信息合成,最终产出一份结构化的报告。其中最核心的一步,正是初始的目标拆解与规划,这极度考验模型的逻辑与规划能力,也直接反映了模型的智能水平。

此前,OpenAI用的是最先进的o3微调模型,而Google在去年12月却仍在使用与Sora同期的Gemini 1.5 Pro,这其中的差距不言而喻。好在,Google这次终于反应过来了,将基座模型更换为目前最新的推理模型——Gemini 2.0 Flash Thinking Experimental。

现在,你可以在Gemini官网直接使用该功能。

目前最吸引人的一点是:它免费。相比之下,OpenAI的Deep Research对使用次数限制严格:Plus会员(20美元/月)每月仅限10次,Pro会员(200美元/月)也只有150次,而未付费用户则完全无法体验。而Google这次至少做了一件非常良心的事:让免费用户也能体验到真正的深度研究,而非简单的深度搜索。

至于免费用户的具体使用次数限制,在官网上并未明确写明,只有一句模糊的提示。

但无论如何,这提供了一个宝贵的免费体验机会。

那么,实际效果如何?我们用一个具体案例来测试。最近笔者在研究电影工业化,其中漫威(Marvel)是一个重点案例。于是输入了以下提示词:“全面、系统地分析漫威(Marvel)在电影工业化进程中的布局与经验,涵盖历史背景、核心战略、制片体系、商业模式、营销策略、技术应用,以及它如何与迪士尼等合作方共同塑造全球化、跨媒体的超级英雄宇宙。通过多角度调研与论证,提炼漫威在现代电影工业发展的成功要素,并思考未来趋势与经验教训。”

与OpenAI的Deep Research不同,Gemini会先将研究框架和步骤清晰地拆解展示出来,待用户点击“开始研究”后,它才会启动全网搜索。而OpenAI的版本则会在搜索过程中动态调整目标。Gemini的方案也允许用户手动修改。

在起手式上,OpenAI通常会通过补充问题范围、激发用户思考来完善研究目标,这一点目前看来略胜一筹。

随后进入搜索阶段。

Gemini默认展示其思维过程,并用大幅UI重点呈现搜索来源,涵盖了海量网站甚至YouTube视频。经过大约10分钟的“思考”,一份报告便呈现在眼前。

坦诚地说,这份关于电影工业化的报告,在详细程度和深度上,与OpenAI产出的报告相比仍有差距。它的搜索非常精准(本次任务检索了约220个网站,相关性很高),但在最后的报告整合与深度提炼环节,表现有所欠缺。报告能解答部分疑惑,但尚未达到“直接可用”的成熟度。而OpenAI的Deep Research,在这一点上做得更好。

这很可能仍是受限于底层模型的能力。如果Google能换上Gemini 2.0 Pro Thinking,效果或许会有大幅提升,当然,那样可能就无法免费了。

不过,有从事科研的朋友反馈,在学术研究领域,得益于Google三十年的搜索积累和Google Scholar的布局,其搜索精准度往往更高,最终得到的报告在某些方面反而更优。当然,这需要更多测试来验证。

总结一下:Gemini Deep Research的模型能力稍弱,但搜索能力强,报告整合能力一般;OpenAI Deep Research搜索精准度中规中矩,但基座模型强大,报告整合与深度提炼能力出众。

必须指出的是,深度研究这类工具,将极大地、快速地提升个人获取高密度信息的上限,并可能深刻改变教育、研究等领域的工作模式。如果你之前因为费用或其他原因从未体验过Deep Research,那么强烈建议你趁Google这个版本目前免费,去亲自尝试一下。

无论是撰写行业报告、总结书籍,还是进行科学研究,先用起来。你会感受到一个全新的信息处理维度。

3. 个性化(Personalization):更懂你的搜索

最后,简要谈谈第三个更新:个性化功能。

首次使用时,系统会提示你是否将其与你的Google账号关联。

关联后,Gemini便能根据你过往的搜索历史,提供更具针对性、个性化的答案。你使用Google搜索越多,它就越“懂”你。当然,这意味着……你懂的。

目前发现一个小问题:当提问中包含英文字母时,回答有时会意外切换成英文。但这无碍于我们看到一个关键趋势:Google终于开始将其过去三十年的生态积累,逐步融入到Gemini之中。这种巨头基于庞大生态构建的优势,不容小觑。

结语

回顾这一周密集的更新,每一项都是扎实的功能进步,更何况Google手中还握有AI视频的王牌Veo 2尚未完全打出。综合来看,Google在AI领域的实力和布局,或许在一定程度上被市场低估了。

AI技术的发展远未触及天花板,人类也远未见识到它的全部潜力。这场竞赛,才刚刚进入精彩的中盘。

来源:https://www.uisdc.com/gemini-2

游乐网为非赢利性网站,所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系youleyoucom@outlook.com。

同类文章
更多
智能体Agent核心原理与未来发展趋势详解

智能体Agent核心原理与未来发展趋势详解

上一篇文章,我们梳理了 Tool、MCP 和 Agent 三者之间的关系。简单来说,核心公式就是 Agent = LLM + Tools,而 MCP 则统一了工具的开发和调用过程。 小学都看得懂!帮你快速了解 Tool、MCP 和 Agent 的基础科普 那篇文章发布后,引发了广泛的讨论。但在后续交

时间:2026-05-25 11:17
一文读懂Tool与MCP及Agent核心概念基础入门指南

一文读懂Tool与MCP及Agent核心概念基础入门指南

在MCP与Agent的开发实践中,我们与众多开发者和用户进行了深入交流。一个普遍的共识是:尽管行业内人人都在谈论MCP和Agent,但真正理解其核心逻辑与演进脉络的人,却寥寥无几。 今天,我们就来系统性地梳理一下这些概念的来龙去脉,并基于当前的实践,对未来的发展趋势做一些展望。 一、缸中之脑:只能说

时间:2026-05-25 11:17
Lovart品牌设计实战测评:4小时高效完成全案设计

Lovart品牌设计实战测评:4小时高效完成全案设计

去年公司正好有个茉莉花茶的包装设计项目,这让我萌生了一个想法:不如就用这个现成的命题,来实测一下最近备受关注的Lovart。看看这款号称“全链路”的AI设计工具,究竟能做到什么程度,又能为设计师的实际工作带来怎样的效率提升。 整个测试过程大约花了四个小时,最终的产出不仅有静态图片,还有一段完整的商拍

时间:2026-05-25 11:17
Kontext工作流搭建与提示词技巧解决出图难题

Kontext工作流搭建与提示词技巧解决出图难题

近期,Kontext工作流在设计师社区中引发了广泛关注。它精准解决了传统图像编辑中的一个核心痛点:以往在Photoshop中需要复杂图层操作才能完成的“P图”任务,如今通过简单的对话指令即可实现。例如,若想将一张拼图素材无缝融入特定场景,替换掉原有的花卉图案,过去需要耗费大量时间反复调试,而现在借助

时间:2026-05-25 11:16
七个技巧助你规避AI编程中的产品债务风险

七个技巧助你规避AI编程中的产品债务风险

想象一下这个场景:你满怀期待地打开AI编程工具,输入指令“帮我开发一个在线商城”。几分钟后,一个看似功能完备的网站诞生了——用户注册、商品展示、购物车、支付、客服、数据分析、营销工具……一应俱全。然而,一个棘手的问题很快浮现:你根本不清楚这些功能是否真正有效,也不知道该如何进行调整和优化。 这背后隐

时间:2026-05-25 11:16
热门专题
更多
刀塔传奇破解版无限钻石下载大全 刀塔传奇破解版无限钻石下载大全
洛克王国正式正版手游下载安装大全 洛克王国正式正版手游下载安装大全
思美人手游下载专区 思美人手游下载专区
好玩的阿拉德之怒游戏下载合集 好玩的阿拉德之怒游戏下载合集
不思议迷宫手游下载合集 不思议迷宫手游下载合集
百宝袋汉化组游戏最新合集 百宝袋汉化组游戏最新合集
jsk游戏合集30款游戏大全 jsk游戏合集30款游戏大全
宾果消消消原版下载大全 宾果消消消原版下载大全
  • 日榜
  • 周榜
  • 月榜
热门教程
更多
  • 游戏攻略
  • 安卓教程
  • 苹果教程
  • 电脑教程