首页
科技
AI时代,如何做好“搞数据”这件头等大事

AI时代,如何做好“搞数据”这件头等大事

热心网友
转载
2025-11-03

就在一个月前,微软为玩家带来了游戏AI助手Gaming Copilot,旨在协助玩家应对高难度挑战、提升操作技巧,同时深入解析游戏机制。然而,当大家正为这位"AI游戏搭子"欢呼时,却有细心的玩家赫然发现,这个所谓的助手竟然悄悄扮演着"特洛伊木马"的角色。

最近一次更新后,海外游戏论坛ResetEra的用户发现,自动安装在电脑上的Gaming Copilot会悄无声息地上传游戏截图和录屏内容。在其隐私设置中,"文本模型训练"选项竟然默认处于开启状态。不过该用户也略带宽慰地提到,微软尚未完全失去底线,至少收录用户语音对话的选项目前还处于关闭状态。

消息传出,玩家社区顿时一片哗然。原本期待这位AI助手能随时响应召唤,解决游戏过程中遇到的难题,不再需要频繁切出游戏查阅攻略。没想到Gaming Copilot竟是个隐藏的"间谍",暗中觊觎着大家的隐私数据。

不得不说,微软在"坑玩家"这件事上几乎形成了习惯。此前的"Edge游戏助手"让电脑变卡顿也就罢了,如今的Gaming Copilot更是把玩家当成了"人肉电池"。这次数据收集行为绝非无心之失,而是有意为之,目的就是让玩家在不知不觉中交出个人数据。

至于微软为何要如此"口蜜腹剑",看完接下来的消息,各位想必就能心领神会。就在Gaming Copilot被曝光会自动上传数据的几乎同一时间,"美国贴吧"Reddit在纽约联邦法院起诉了AI搜索新锐Perplexity AI,指控其通过"工业规模的非法抓取"行为,未经许可复制Reddit用户的评论以牟取商业利益。

数据如同化石燃料般正在枯竭,AI革命正疯狂"吸干"互联网数据的海洋,这是AI专业人士从去年就开始不断发出的警告。而在2025年,AI行业更是出现了一个耐人寻味的现象:各大厂商的模型不约而同地放弃了通用化路线,开始追逐差异化优势。比如OpenAI的GPT-5擅长搜索、谷歌的Gemini 2精于数学推理,而Anthropic的Claude 4则在代码生成方面表现出色。

事实上,不同厂商的AI模型各有所长,根本原因在于它们在RLHF(基于人类反馈的强化学习)阶段采取了不同策略。按照OpenAI前首席科学家Ilya Sutskever的说法,决定RLHF阶段效果的关键,除了算法优劣外,数据质量更是决定性因素。这背后反映出一个现实:大模型的迭代已经从纯粹的参数规模膨胀,转向了高质量数据的萃取。

大模型的训练本就依赖海量数据,如果输入的数据存在错漏,训练出的模型自然会"学坏",输出结果同样会成为"垃圾"。没错,与人类一样,一旦接触低质信息过多,大模型也会出现认知退化的"脑腐"现象。

大模型持续暴露于垃圾数据的具体表现,包括推理能力下降、上下文理解能力变差、伦理规范意识减弱等系统性退化,且这一趋势具有不可逆性,难以通过后期微调修复。为避免自家模型不进反退,各大AI厂商自然也开始千方百计地寻求高质量数据。

但遗憾的是,论文、书籍等高质量数据已被消耗殆尽。由于AI厂商一口气吞噬了过去三十年间互联网世界积累的绝大部分知识,才造就了大模型在过去两年迎来"寒武纪生命大爆发"。如今凝聚了人类智慧结晶的高质量数据濒临枯竭,AI厂商被迫在沙海淘金,尽管Reddit的社交数据、Gaming Copilot收集的玩家行为数据质量堪忧,但好歹也是能产出保证的数据。

如今的矛盾之处在于,不仅AI厂商认识到一切数据都有价值,像Reddit这样的数据拥有者也不例外。从某种意义上说,AI初创企业的至暗时刻其实是2025年,因此在此之后,巨头和初创企业获取数据能力的差距,会让后者再难获得弯道超车的机会。

以微软和Perplexity AI为例,在合法合规的情况下,前者获取数据的能力显然碾压后者。毕竟微软旗下产品极为丰富,Office可以贡献办公数据、Gaming Copilot能带来游戏数据,因此微软能够收集到量大而全的数据。

反观Perplexity AI,尽管作为AI搜索独角兽在赛道中崭露头角,甚至其AI搜索引擎一度让谷歌搜索左支右绌。可Perplexity AI仅有AI搜索这一个产品,这就注定了他们只能从1500万活跃用户身上获取数据。如果仅靠自家用户获取数据,Perplexity AI注定将迎来"加拉帕戈斯化",即在孤立的市场环境下进行"最适化",从而丧失与区域外的互换性,进而导致产品与主流需求脱节。

如果Perplexity AI不向外界"掠夺"数据,他们的AI出现"脑腐"的概率自然要远高于微软的Copilot。简而言之,AI赛道百舸争流、千帆竞逐的场面,很有可能在未来一两年内结束。因为拥有数据的平台不会让AI厂商平白无故地拿走数据,这就会导致资金匮乏的初创企业失去数据源。

毕竟当微软等AI大厂能利用旗下各种产品悄悄获取用户数据,而Perplexity AI等初创企业只能去"抢"的情况下,长此以往,双方的差距只会越来越大。

【本文图片来自网络】

来源:https://36kr.com/p/3537279411542918

免责声明

游乐网为非赢利性网站,所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系youleyoucom@outlook.com。

同类文章

2025视频相机排行榜:帮你精准选择Vlog、直播与短视频设备

随着视频内容与Vlog创作的普及,一台轻便、画质出色、功能针对性强的好相机,已成为众多创作者的刚需。无论是记录生活、旅行随拍,还是专业短视频、直播带货,选对设备往往能事半功倍。我们整理了一份2025

2025-11-03.

iPhone 16为新机让路,Vision Pro亮相后价格直降

近日,苹果在正式直接上架了新款Vision Pro。相比于上一代在发布时大量的宣传,新款Vision Pro显得十分低调。值得一提的是,由于iPhone17新机的上市,导致iPhone16价格持续走

2025-11-03.

三星S26参数全面解析 对比iPhone16改写性价比历史

11月3日,有博主曝光了三星新款旗舰手机S26 Ultra的详细配置信息。爆料显示,S26 Ultra的机身厚度为7 9毫米,镜头凸起厚度为4 5毫米。比小米17 Pro Max 8 0毫米的机身厚

2025-11-03.

台积电披露年度业绩:iPhone16售价或涨,果粉心碎!

近日,数据机构Counterpoint预测,2025年foundry2 0业务的全球销售额台积电将占39%。值得一提的是,由于iPhone17新机的上市,导致iPhone16价格持续走低。据权威科技

2025-11-03.

iPhone 17销量下滑16%,果粉转向百元机成趋势

11月3日,研究机构CounterpointResearch最新数据显示,苹果iPhone 17系列在美国和中国市场上市前十天的销量表现强劲,较上一代iPhone 16系列同期增长14%。值得一提的

2025-11-03.

热门教程

更多
  • 游戏攻略
  • 安卓教程
  • 苹果教程
  • 电脑教程

最新下载

更多
贪吃蛇大作战2025
贪吃蛇大作战2025 休闲益智 2025-11-03更新
查看
小小炼金术师
小小炼金术师 休闲益智 2025-11-03更新
查看
群雄时代
群雄时代 棋牌策略 2025-11-03更新
查看
梦魇
梦魇 动作冒险 2025-11-03更新
查看
贪吃蛇大作战体验服
贪吃蛇大作战体验服 休闲益智 2025-11-03更新
查看
掘地求财MOD作弊菜单
掘地求财MOD作弊菜单 休闲益智 2025-11-03更新
查看
贪吃蛇大作战腾讯
贪吃蛇大作战腾讯 休闲益智 2025-11-03更新
查看
贪吃蛇大作战3D
贪吃蛇大作战3D 休闲益智 2025-11-03更新
查看
太古仙尊vivo
太古仙尊vivo 角色扮演 2025-11-03更新
查看
贪吃蛇大作战九游
贪吃蛇大作战九游 休闲益智 2025-11-03更新
查看