Tinker首秀:开发者必备的大模型后训练解决方案

OpenAI前首席技术官米拉·穆拉蒂(Mira Murati)创立的人工智能初创公司Thinking Machines,近日正式发布首个AI开发工具Tinker。这款面向语言模型研究者的API产品,致力于帮助开发者摆脱底层复杂性,将更多精力投入到算法创新和数据优化之中。
作为一款跨模型开发工具,Tinker支持包括Qwen-235B-A22B在内的一线大模型。其核心技术亮点是采用了LoRA(低秩适应)资源共享方案。根据团队技术博客披露的数据,这种多任务共享计算资源的方法,可为跨模型训练节省大量硬件投入成本。
为加速AI开发者上手使用,团队同步开源了Tinker Cookbook代码资源库。其中整合了伊利诺伊大学香槟分校研发的Search-R1工具,该工具创新的"推理即搜索"机制可显著增强模型决策能力。开发者可以直接调用内置的现代实现模板,快速搭建个性化训练流程。
在实际学术应用中,Tinker已展现出令人瞩目的性能表现。普林斯顿Goedel研究团队利用该工具训练数学定理证明器,仅需常规20%的数据量就实现了全参数微调的模型性能,在MiniF2F数学基准测试中获得了90.4%的高准确率。斯坦福Rotskoff化学研究组则借助Tinker的强化学习功能,成功将LLaMA 70B模型的化学公式转换准确率从15%提升到50%。伯克利的SkyRL团队更是通过其异步训练框架,开创性地完成了多智能体协同强化学习实验。
作为早期测试用户,Anyscale公司CEO罗伯特·尼希哈拉(Robert Nishihara)特别赞赏Tinker在简化分布式训练的同时,仍完整保留了对数据和算法的控制自由度。伯克利博士生泰勒·格里格斯(Tyler Griggs)则强调了工具的高度灵活性:"传统RL微调服务往往固化训练逻辑,而Tinker让我们可以完全专注于环境建模和算法设计。"
目前Tinker正处于限量内测阶段,已开放早期体验申请入口。Thinking Machines透露初期将提供免费服务,未来计划推出按量计费的商用方案。穆拉蒂在发布会上表示:"在当前AI研究两极分化的环境下,我们希望通过降低技术门槛,让更多创新者能接触到最前沿的模型调优能力。"
免责声明
游乐网为非赢利性网站,所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系youleyoucom@outlook.com。
同类文章
高德扫街榜真实数据引导4亿人选美食,国庆假期迎消费热
国庆长假首日,移动出行领域传来新消息:高德地图当日日活跃用户(DAU)突破3亿,超越去年全年峰值。次日,该平台宣布国庆首日DAU达3 6亿,相当于每3名中国互联网用户中就有1人使用高德。作为日均DA
如何选择AI优化服务?从技术到服务全面解析合作标准
在数字化转型浪潮下,人工智能优化技术正成为企业提升竞争力的关键工具。从生产调度到客户服务,从供应链管理到电商运营,AI技术通过精准分析、动态调整和自动化执行,帮助企业实现效率跃升与成本下降。当前市场
Meta大牛携斯坦福博士打造AI数学家,斩获6400万融资
在斯坦福大学附近的Verve Coffee Roasters咖啡馆里,一场改变科技行业轨迹的对话悄然展开。当时仍是博士生的Carina Hong与前meta AI研究员Shubho Sengupta
SuperX AI工厂6个月快速交付,模块化解锁算力部署困局
人工智能基础设施领域迎来突破性进展,SuperX公司(纳斯达克上市代码:SUPX)正式推出模块化AI工厂解决方案。该全栈式产品通过重构数据中心建设模式,直击传统架构存在的建设周期冗长、运营成本高企、
贝索斯预言:未来20年内或将建成太空千兆瓦数据中心
随着地球数据中心对冷却服务器所需的水电资源需求持续攀升,科技行业正将目光投向太空。据路透社报道,亚马逊创始人杰夫·贝索斯近日提出,未来十年至二十年间,千兆瓦级太空数据中心有望成为现实。贝索斯指出,太
热门推荐
热门教程
更多- 游戏攻略
- 安卓教程
- 苹果教程
- 电脑教程


















