当前位置: 首页
AI
12000 tokens/s:Taalas集群跑DeepSeek R1创速度纪录

12000 tokens/s:Taalas集群跑DeepSeek R1创速度纪录

热心网友 时间:2026-02-21
转载

2月21日,IT之家援引科技媒体Wccftech的最新报道称,AI芯片初创公司Taalas推出了一项名为“硬连线”的前沿技术,旨在直接化解大模型应用中的延迟与成本瓶颈——通过将AI模型直接固化在硅芯片内部来实现性能跃升。

免费影视、动漫、音乐、游戏、小说资源长期稳定更新! 👉 点此立即查看 👈

在当前AI算力竞争日趋白热化的背景下,响应延迟已成为制约智能体大规模应用的核心障碍。与Cerebras或Groq等公司尝试通过集成SRAM来加速的路径不同,成立仅两年半的Taalas选择了一条更为激进的ASIC路线。

据IT之家引述的博文介绍,该公司研发出一套能够将任意AI模型转化为定制化硅片的平台。其底层核心逻辑在于“计算与存储的融合”,通过将特定大语言模型的神经网络直接映射至硅片电路之中,从而在DRAM级别的密度下完成所有计算操作。

这种设计方案彻底摒弃了传统的HBM内存、复杂封装以及昂贵的散热系统,从物理层面根除了数据传输中的“内存墙”障碍。

每秒12000 tokens吞吐:Taalas集群跑DeepSeek R1创速度纪录

Taalas已展示了其首款产品HC1,该芯片专为Meta的Llama 3.1 8B模型量身打造。从技术规格来看,HC1采用台积电6纳米工艺制造,芯片面积高达815平方毫米,这一尺寸几乎与NVIDIA的H100相当。

Taalas的在线聊天机器人演示在EE Times试用时达到了每秒超过15,000 tokens的输出速度。但公司方面透露,在特定优化条件下,内部测试数据已接近每秒17000 tokens。

每秒12000 tokens吞吐:Taalas集群跑DeepSeek R1创速度纪录

然而,巨大的芯片面积仅能容纳80亿参数的模型,这与当前动辄万亿参数的前沿大模型相比,显得“容量有限”。这表明,为了实现极致的硬连线速度,Taalas在单位面积的参数密度上做出了巨大妥协,这也是该技术路线面临的主要物理限制之一。

每秒12000 tokens吞吐:Taalas集群跑DeepSeek R1创速度纪录

尽管参数密度不高,但HC1的性能表现极具颠覆性。最新数据显示,相比现有的高端算力基础设施,Taalas方案的每秒Token生成数量提升了10倍之多,同时生产成本降至二十分之一。

为了解决单芯片容量不足的问题,Taalas采用了集群化扩展策略。在针对DeepSeek R1模型的测试中,通过30片芯片的集群配置,实现了高达每秒12000 TPS/User的吞吐速度。这一数据意味着在实时交互和复杂推理任务中,用户将获得近乎零延迟的流畅体验。

TPS是衡量大语言模型生成速度的关键指标,代表了模型每秒能输出多少个文本单位。这好比打字员的打字速度,TPS越高,AI回复得就越快,用户等待的时间就越短。

该媒体指出,Taalas的技术路线虽然前景诱人,但其商业模式面临独特挑战。由于模型权重被“硬连线”固化在硅片之中,芯片一旦制造完成便无法更改模型参数。

这意味着客户必须为特定的模型版本购买专用硬件,一旦算法迭代更新,原有的硬件可能面临迅速淘汰的风险。

来源:https://tech.ifeng.com/c/8qv3vPg2hRs

游乐网为非赢利性网站,所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系youleyoucom@outlook.com。

同类文章
更多
阿里千问发布全模态大模型 Qwen3.5-Omni,无缝理解文本、图片、音频及音视频输入

阿里千问发布全模态大模型 Qwen3.5-Omni,无缝理解文本、图片、音频及音视频输入

阿里千问重磅发布Qwen3 5-Omni:全能全模态大模型,解锁音视频实时交互新时代 2025年,阿里千问(通义千问)正式推出了其革命性的Qwen3 5-Omni全模态大型语言模型。此次发布标志着人工智能模型能力边界的重大突破,从传统的文本、图像处理,全面迈入了复杂的音频、视频理解与实时对话交互的新

时间:2026-04-01 20:04
WorkBuddy,是腾讯最近推出的一款 AI 桌面智能体

WorkBuddy,是腾讯最近推出的一款 AI 桌面智能体

腾讯WorkBuddy:你的“数字同事”已上线 最近科技圈热议的WorkBuddy,是腾讯推出的AI桌面智能体,被用户亲切地称为 "腾讯版小龙虾 "。简单来说,它就像驻扎在你电脑里的智能助手,不仅能理解自然语言指令,还能直接操作软件完成各项任务。

时间:2026-04-01 19:56
openclaw 详细的新手部署教程 window11 详细教程

openclaw 详细的新手部署教程 window11 详细教程

一、安装 Node js 首先,你需要在电脑上安装 Node js 运行环境。很简单,分三步完成。 第一步:下载安装包。 直接访问 Node js 官网(nodejs org),找到并下载 LTS(长期支持)版本。当前比较推荐 v22 及以上版本,稳定性更好。 第二步:执行安装。 下载完成后,打开安

时间:2026-04-01 19:55
小米米家智能空气炸锅 Pro 蒸烤版 6.5L 开启众筹,559 元

小米米家智能空气炸锅 Pro 蒸烤版 6.5L 开启众筹,559 元

小米米家智能空气炸锅Pro蒸烤版6 5L众筹开启:一机多能,仅559元起 3月30日消息,小米米家旗下新款厨房智能电器——米家智能空气炸锅 Pro 蒸烤版 6 5L 现已正式启动众筹。该款多功能空气炸锅官方建议零售价为749元,而本次限时众筹专享价仅为559元,优惠力度显著。众筹活动已于3月30日上

时间:2026-04-01 19:51
阿里千问充话费可用支付宝 AI 付,限时立减 5 元

阿里千问充话费可用支付宝 AI 付,限时立减 5 元

支付宝“AI付”再添新场景:千问App充话费限时立减5元 近期的AI应用领域可谓动态频频,新玩法层出不穷。支付宝联合阿里通义千问App,推出了一项全新福利活动:自3月30日至4月6日期间,用户只需打开通义千问App,即可领取专属的“AI充话费体验金”,在充值时直接享受立减5元的优惠。 具体该如何操作

时间:2026-04-01 19:47
热门专题
更多
刀塔传奇破解版无限钻石下载大全 刀塔传奇破解版无限钻石下载大全
洛克王国正式正版手游下载安装大全 洛克王国正式正版手游下载安装大全
思美人手游下载专区 思美人手游下载专区
好玩的阿拉德之怒游戏下载合集 好玩的阿拉德之怒游戏下载合集
不思议迷宫手游下载合集 不思议迷宫手游下载合集
百宝袋汉化组游戏最新合集 百宝袋汉化组游戏最新合集
jsk游戏合集30款游戏大全 jsk游戏合集30款游戏大全
宾果消消消原版下载大全 宾果消消消原版下载大全
  • 日榜
  • 周榜
  • 月榜
热门教程
更多
  • 游戏攻略
  • 安卓教程
  • 苹果教程
  • 电脑教程