当前位置: 首页
科技数码
AI时代,如何做好“搞数据”这件头等大事

AI时代,如何做好“搞数据”这件头等大事

热心网友 时间:2025-11-03
转载

就在一个月前,微软为玩家带来了游戏AI助手Gaming Copilot,旨在协助玩家应对高难度挑战、提升操作技巧,同时深入解析游戏机制。然而,当大家正为这位"AI游戏搭子"欢呼时,却有细心的玩家赫然发现,这个所谓的助手竟然悄悄扮演着"特洛伊木马"的角色。

免费影视、动漫、音乐、游戏、小说资源长期稳定更新! 👉 点此立即查看 👈

最近一次更新后,海外游戏论坛ResetEra的用户发现,自动安装在电脑上的Gaming Copilot会悄无声息地上传游戏截图和录屏内容。在其隐私设置中,"文本模型训练"选项竟然默认处于开启状态。不过该用户也略带宽慰地提到,微软尚未完全失去底线,至少收录用户语音对话的选项目前还处于关闭状态。

消息传出,玩家社区顿时一片哗然。原本期待这位AI助手能随时响应召唤,解决游戏过程中遇到的难题,不再需要频繁切出游戏查阅攻略。没想到Gaming Copilot竟是个隐藏的"间谍",暗中觊觎着大家的隐私数据。

不得不说,微软在"坑玩家"这件事上几乎形成了习惯。此前的"Edge游戏助手"让电脑变卡顿也就罢了,如今的Gaming Copilot更是把玩家当成了"人肉电池"。这次数据收集行为绝非无心之失,而是有意为之,目的就是让玩家在不知不觉中交出个人数据。

至于微软为何要如此"口蜜腹剑",看完接下来的消息,各位想必就能心领神会。就在Gaming Copilot被曝光会自动上传数据的几乎同一时间,"美国贴吧"Reddit在纽约联邦法院起诉了AI搜索新锐Perplexity AI,指控其通过"工业规模的非法抓取"行为,未经许可复制Reddit用户的评论以牟取商业利益。

数据如同化石燃料般正在枯竭,AI革命正疯狂"吸干"互联网数据的海洋,这是AI专业人士从去年就开始不断发出的警告。而在2025年,AI行业更是出现了一个耐人寻味的现象:各大厂商的模型不约而同地放弃了通用化路线,开始追逐差异化优势。比如OpenAI的GPT-5擅长搜索、谷歌的Gemini 2精于数学推理,而Anthropic的Claude 4则在代码生成方面表现出色。

事实上,不同厂商的AI模型各有所长,根本原因在于它们在RLHF(基于人类反馈的强化学习)阶段采取了不同策略。按照OpenAI前首席科学家Ilya Sutskever的说法,决定RLHF阶段效果的关键,除了算法优劣外,数据质量更是决定性因素。这背后反映出一个现实:大模型的迭代已经从纯粹的参数规模膨胀,转向了高质量数据的萃取。

大模型的训练本就依赖海量数据,如果输入的数据存在错漏,训练出的模型自然会"学坏",输出结果同样会成为"垃圾"。没错,与人类一样,一旦接触低质信息过多,大模型也会出现认知退化的"脑腐"现象。

大模型持续暴露于垃圾数据的具体表现,包括推理能力下降、上下文理解能力变差、伦理规范意识减弱等系统性退化,且这一趋势具有不可逆性,难以通过后期微调修复。为避免自家模型不进反退,各大AI厂商自然也开始千方百计地寻求高质量数据。

但遗憾的是,论文、书籍等高质量数据已被消耗殆尽。由于AI厂商一口气吞噬了过去三十年间互联网世界积累的绝大部分知识,才造就了大模型在过去两年迎来"寒武纪生命大爆发"。如今凝聚了人类智慧结晶的高质量数据濒临枯竭,AI厂商被迫在沙海淘金,尽管Reddit的社交数据、Gaming Copilot收集的玩家行为数据质量堪忧,但好歹也是能产出保证的数据。

如今的矛盾之处在于,不仅AI厂商认识到一切数据都有价值,像Reddit这样的数据拥有者也不例外。从某种意义上说,AI初创企业的至暗时刻其实是2025年,因此在此之后,巨头和初创企业获取数据能力的差距,会让后者再难获得弯道超车的机会。

以微软和Perplexity AI为例,在合法合规的情况下,前者获取数据的能力显然碾压后者。毕竟微软旗下产品极为丰富,Office可以贡献办公数据、Gaming Copilot能带来游戏数据,因此微软能够收集到量大而全的数据。

反观Perplexity AI,尽管作为AI搜索独角兽在赛道中崭露头角,甚至其AI搜索引擎一度让谷歌搜索左支右绌。可Perplexity AI仅有AI搜索这一个产品,这就注定了他们只能从1500万活跃用户身上获取数据。如果仅靠自家用户获取数据,Perplexity AI注定将迎来"加拉帕戈斯化",即在孤立的市场环境下进行"最适化",从而丧失与区域外的互换性,进而导致产品与主流需求脱节。

如果Perplexity AI不向外界"掠夺"数据,他们的AI出现"脑腐"的概率自然要远高于微软的Copilot。简而言之,AI赛道百舸争流、千帆竞逐的场面,很有可能在未来一两年内结束。因为拥有数据的平台不会让AI厂商平白无故地拿走数据,这就会导致资金匮乏的初创企业失去数据源。

毕竟当微软等AI大厂能利用旗下各种产品悄悄获取用户数据,而Perplexity AI等初创企业只能去"抢"的情况下,长此以往,双方的差距只会越来越大。

【本文图片来自网络】

来源:https://36kr.com/p/3537279411542918

游乐网为非赢利性网站,所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系youleyoucom@outlook.com。

同类文章
更多
AI能从单份血样检出多种神经疾病

AI能从单份血样检出多种神经疾病

来源:科技日报科技日报讯 (记者刘霞)由瑞典隆德大学领衔的国际研究团队,研发出一款新的人工智能(AI)模型。该模型仅需一份血液样本,便能精准识别多种神经退行性疾病。团队期望,该AI模型未来能实现“一

时间:2026-04-07 14:55
褪去虚火,脑机接口方能释放长远价值

褪去虚火,脑机接口方能释放长远价值

来源:科技日报2026年开年,马斯克宣称脑机接口产品将于年内启动量产,引爆全球市场情绪。国内资本随即扎堆追捧,脑机接口相关概念股大幅走高,行业短期炒作虚火蔓延。进入3月,脑机接口迎来多重利好:脑机接

时间:2026-04-07 14:55
黎万强、洪锋退出小米科技股东名单

黎万强、洪锋退出小米科技股东名单

人民财讯4月7日电,企查查APP显示,近日,小米科技有限责任公司发生工商变更,原股东小米联合创始人黎万强、洪锋退出,同时,注册资本由18 5亿元减至约14 8亿元。 企查查信息显示,该公司成立于20

时间:2026-04-07 14:55
新闻分析|“阿耳忒弥斯2号”任务为何只绕月不登月

新闻分析|“阿耳忒弥斯2号”任务为何只绕月不登月

  新华社北京4月7日电 新闻分析|“阿耳忒弥斯2号”任务为何只绕月不登月  新华社记者张晓茹  美国东部时间6日18时40分许(北京时间7日6时40分许),执行美国“阿耳忒弥斯2号”载人绕月飞行任

时间:2026-04-07 14:55
“链接未来·智汇静安”区块链创新应用优秀场景分享(四)| 信医基于区块链与隐私计算的真实世界研究数据产品

“链接未来·智汇静安”区块链创新应用优秀场景分享(四)| 信医基于区块链与隐私计算的真实世界研究数据产品

聚焦数字技术,释放创新动能。为集中展示静安区区块链技术从“实验室”走向“应用场”的丰硕成果,挖掘一批可复制、可推广的行业解决方案,加速构建区块链产业生态闭环,静安区数据局特推出“静安区区块链创新应用

时间:2026-04-07 14:55
热门专题
更多
刀塔传奇破解版无限钻石下载大全 刀塔传奇破解版无限钻石下载大全
洛克王国正式正版手游下载安装大全 洛克王国正式正版手游下载安装大全
思美人手游下载专区 思美人手游下载专区
好玩的阿拉德之怒游戏下载合集 好玩的阿拉德之怒游戏下载合集
不思议迷宫手游下载合集 不思议迷宫手游下载合集
百宝袋汉化组游戏最新合集 百宝袋汉化组游戏最新合集
jsk游戏合集30款游戏大全 jsk游戏合集30款游戏大全
宾果消消消原版下载大全 宾果消消消原版下载大全
热门教程
更多
  • 游戏攻略
  • 安卓教程
  • 苹果教程
  • 电脑教程