当前位置: 首页
AI
DeepSeek开眼功能上线引发AI行业震动

DeepSeek开眼功能上线引发AI行业震动

热心网友 时间:2026-05-17
转载

DeepSeek的“鲸鱼”,终于睁开了眼睛。

今日,DeepSeek团队负责多模态开发的研究员陈小康在社交平台X上发布了一条动态:“Now, we see you”。配图中,那个标志性的鲸鱼logo,悄然摘下了眼罩。

突发!DeepSeek“开眼”,AI圈一夜腥风血雨

几乎与此同时,众多用户发现,DeepSeek的网页版悄然上线了一项新功能——“识图模式”。在此模式下,用户可以上传图片,交由AI模型进行内容理解和分析。不过,该功能目前尚未全面开放,仍处于灰度测试阶段,仅部分用户能看到入口。

突发!DeepSeek“开眼”,AI圈一夜腥风血雨

从“文本王者”到“视觉补课”

回顾DeepSeek的崛起之路,其核心竞争力始终建立在文本推理的极致性价比之上。无论是V3还是R1模型,都以相对较低的训练成本,实现了接近甚至超越闭源巨头的逻辑推理能力,堪称行业“价格屠夫”。然而,其短板也同样明显:长期以来,它仅能处理文字,无法“看见”和理解图像。

这在日常使用中难免带来割裂感。当其他AI助手可以随手分析一张Excel截图数据,或根据草图生成对应代码时,同样的操作在过去的DeepSeek上却无法实现。它能撰写代码、解答数学题、梳理复杂大纲,但一旦遇到图片,就只能礼貌地表示无能为力。

但要成为一个真正的平台级AI助手,视觉理解能力几乎是必答题,DeepSeek也不例外。现实世界中的信息载体远不止文字:一张发票、一份报表、路牌标识、商品包装、设计草图、甚至社交媒体截图……如果AI无法理解这些视觉信息,其应用场景和实用性无疑会受到大幅限制。

如今,“识图模式”的登场,标志着DeepSeek的产品能力正式从纯文本对话,延伸至图文交互的新战场。这不仅是功能的简单叠加,更是补齐了其与GPT-4、Gemini等主流多模态大模型之间最关键的一块能力拼图。

突发!DeepSeek“开眼”,AI圈一夜腥风血雨

入场虽晚,挑战与机遇并存

不可否认,DeepSeek此时入局多模态视觉赛道,面临的压力不容小觑。OpenAI的GPT系列在视觉理解上已相当成熟,而Google的Gemini从设计之初就是多模态原生架构。Anthropic的Claude在图表和文档解析方面也日益精进。用户的期待早已被这些先行者拔高,DeepSeek若想再次扮演“黑马”角色,仅仅实现“能看图”是远远不够的,必须拿出一些独特的“绝活”。

真正的机会点或许在于其自身优势的融合。例如,将其擅长的深度推理能力与视觉理解相结合:面对一张复杂的数据趋势图,不仅能准确描述图表内容,更能推导出背后的商业洞察;分析一张设备结构图或电路图,不仅能识别元件,还能给出潜在的故障诊断或优化建议。这种“视觉感知+逻辑推理”的深度结合,才是形成差异化竞争力的关键。

可以预见,视觉理解能力的开放只是一个开始。后续,DeepSeek很可能逐步解锁图像生成、视频理解等更高阶的多模态能力。如果未来能将其“专家模式”下的深度思考链,与“识图模式”的视觉感知无缝结合,那么DeepSeek在需要复杂图文推理的场景中——比如学术研究、技术分析、创意策划等——的表现将非常值得期待。

突发!DeepSeek“开眼”,AI圈一夜腥风血雨

鲸鱼摘下了眼罩,这只是它“看见”世界的第一步。但更关键的问题是,在“看见”之后,它能否给出令人眼前一亮的解读?能否在已然拥挤的赛道中,开辟出独特的价值路径?能否像它在文本领域所做的那样,再次带来一些哪怕微小、却足以触动行业的改变?这才是市场对那个熟悉的、总带来惊喜的DeepSeek,最深层的期待。

来源:https://tech.ifeng.com/c/8sj3Wqp9mYT

游乐网为非赢利性网站,所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系youleyoucom@outlook.com。

同类文章
更多
8G显存大模型硬件配置指南与可运行模型推荐

8G显存大模型硬件配置指南与可运行模型推荐

想在本地部署大语言模型,但只有一张8GB显存的显卡?这完全可行。关键在于精准选择模型与量化方案,在有限的硬件资源下实现最优性能。本文将为您详细解析适配8G显存的各类主流模型及其具体部署运行方案。 一、4-bit量化模型部署指南 对于RTX 3060、RTX 4060等主流消费级显卡,4-bit量化是

时间:2026-05-17 20:41
Canva证书制作教程:培训结业奖状DIY模板免费下载

Canva证书制作教程:培训结业奖状DIY模板免费下载

制作一份兼具专业质感与视觉美感的证书,其实可以非常高效。借助Canva可画这类在线设计平台,即便是零基础的新手,也能轻松完成从模板挑选到成品导出的全流程。接下来,我们将详细解析使用Canva可画制作专业级证书的五个关键步骤。 一、选用专业证书模板 好的开始是成功的一半。在Canva可画,第一步变得异

时间:2026-05-17 20:41
Perplexity Pages页面不被收录如何检查Robots与SEO设置

Perplexity Pages页面不被收录如何检查Robots与SEO设置

许多用户在通过Perplexity Pages发布内容后,常常遇到一个关键问题:页面已经成功发布,但在Google、Bing等主流搜索引擎中却无法被搜索到。这通常并非搜索引擎的延迟,而是页面在技术配置或SEO设置上存在障碍,导致爬虫无法顺利抓取和索引。 简单来说,导致页面无法被收录的核心原因通常集中

时间:2026-05-17 20:40
Harness 是 AI Agent 的未来还是辅助工具

Harness 是 AI Agent 的未来还是辅助工具

Harness,作为AI工程化进程中的关键组件,正成为提升大模型实际效能的核心手段。它要解决的核心痛点,是“模型具备潜力,但输出不稳定”。在当前阶段,Harness不可或缺,它能让能力尚不完善的模型可靠地投入生产环境。这好比一副可靠的支架——在腿部力量完全恢复之前,它是行走的必备支持。 近期GitH

时间:2026-05-17 20:40
千问AI数学解题能力实测 辅导作业实用指南

千问AI数学解题能力实测 辅导作业实用指南

辅导孩子数学作业时遇到难题怎么办?别担心,现在有一位聪明的“AI家教”可以随时求助——千问AI。它不仅能提供详细的解题步骤,还能解析核心概念、梳理知识脉络,让数学学习过程更加清晰高效。关键在于,你需要掌握与它高效沟通的方法。 一、输入完整题目并明确需求 想要获得AI的精准解答,首先必须提供清晰的“问

时间:2026-05-17 20:39
热门专题
更多
刀塔传奇破解版无限钻石下载大全 刀塔传奇破解版无限钻石下载大全
洛克王国正式正版手游下载安装大全 洛克王国正式正版手游下载安装大全
思美人手游下载专区 思美人手游下载专区
好玩的阿拉德之怒游戏下载合集 好玩的阿拉德之怒游戏下载合集
不思议迷宫手游下载合集 不思议迷宫手游下载合集
百宝袋汉化组游戏最新合集 百宝袋汉化组游戏最新合集
jsk游戏合集30款游戏大全 jsk游戏合集30款游戏大全
宾果消消消原版下载大全 宾果消消消原版下载大全
  • 日榜
  • 周榜
  • 月榜
热门教程
更多
  • 游戏攻略
  • 安卓教程
  • 苹果教程
  • 电脑教程