首次剖析代码Agent上下文检索机制:突破自动化开发瓶颈
新智元报道编辑:LRST【新智元导读】ContextBench首次从「过程」评测代码智能体,不再只看是否修好代码,而是追踪它是否精准找到并真正使用了关键代码片段,揭示了当前模型多读少用、被关键词误导
arXiv创始人钓鱼实验:13个顶尖AI全部中招编造假论文
新智元报道编辑:元宇【新智元导读】arXiv创始人一场钓鱼实验,竟把所有顶尖大模型都「拉下水」,谁让学术殿堂,变成AI垃圾场?如果在电脑上敲下一行字:嘿,帮我编一篇假论文。那些被大厂标榜为「安全对齐
AI科学家攻克《宇宙弦》难题:Gemini提供最优优雅解法
新智元报道编辑:定慧【新智元导读】就在刚刚,Google Research团队用Gemini Deep Think + 树搜索框架,独立攻克了一个理论物理领域的未解积分难题——宇宙弦引力辐射功率谱的
SeeDance2.0大模型降智?字节意外成硅谷门外“野蛮人”
文 | 道总有理排队、降智、审核不通过…年初引爆科技圈、被称为“当前地表最强”的字节系视频模型Seedance 2 0,正在从最初的惊艳转变为层层的质疑。根据《每日经济新闻》记者在27日下午高峰时段
比亚迪王传福终结电动化上半场:9分钟充满告别里程焦虑
技术之外,没有画饼,10 款新车同步上市。作者|周永亮编辑|靖宇近几个月,中国新能源市场似乎进入了「瓶颈期」。渗透率出现波动,新车看着像「套娃」,大家都在卷配置、卷冰箱彩电大沙发,但「低温趴窝」和「
Claude人工智能伪造身份部署入侵,比黑客攻击更可怕的威胁
新智元报道编辑:定慧【新智元导读】Vercel CEO亲自曝光了一起令人后背发凉的AI安全事件:一个基于Claude Opus 4 6的AI编程智能体,在执行部署任务时没有调用任何查询接口,直接脑补
Anthropic报告揭示AI对高薪职业冲击,替代进度超出预期
3月6日,Anthropic近日发布了关于AI对劳动力市场影响的最新研究报告,提出结合Claude大模型实际应用数据的实际暴露度新指标。研究指出,目前AI的实际应用远不及理论上限,但程序员、客服等
AI导致中产贬值:应届生如何用AI助手破局上岗
2026年开年,是AI大年。它曾是PPT里的未来,是趋势,是风口,如今,却变成了打工人的威胁。近日,美国金融科技公司Block宣布计划裁员约40%,超过4000名员工。讽刺又残酷的是,该公司业绩远超
热门文章
2026-01-30 11:43
2026-01-30 11:37
2026-01-30 11:31
2026-01-30 11:25
2026-01-29 22:46
2026-01-29 22:40
2026-01-29 22:33
2026-01-29 18:40
最新文章
