当前位置: 首页
AI
昆仑万维天工13B大模型免费开源支持商业应用

昆仑万维天工13B大模型免费开源支持商业应用

热心网友 时间:2026-05-16
转载

10月底,国内AI开源社区迎来了一枚重磅冲击波。昆仑万维正式宣布,开源其百亿级大语言模型「天工」Skywork-13B系列。这本身已足够引人注目,但更罕见的是,这次开源还配套放出了一个高达600GB、包含1500亿Tokens的超大规模高质量中文数据集。这种“模型+数据”双开源的组合拳,在业内并不多见,诚意和分量都相当足。

简单来说,这次开源的Skywork-13B系列包含两个核心模型:一个是通用基础模型Skywork-13B-Base,另一个是专门强化了数学推理能力的Skywork-13B-Math。根据官方发布的数据,这两个模型在CEVAL、CMMLU、MMLU、GSM8K等多个权威评测基准上,都展现出了同规模模型中的领先性能,尤其是在中文科技、金融、政务等垂直领域的表现,优于其他开源竞品。

当然,最受开发者关注的,无疑是其商用政策。与许多开源模型设置复杂授权门槛不同,Skywork-13B系列宣布全面开放商用——开发者无需额外申请,在同意相关协议后即可直接用于商业场景。这无疑大大降低了技术落地的门槛。

两大模型与一个“超级数据集”

我们来具体拆解一下这次开源的核心内容。

首先是两大模型:

  • Skywork-13B-Base模型:作为系列的基础模型,它经过了3.2万亿个多语言高质量Token的训练。在多项综合评测中,它都实现了对同级别开源模型(如LLaMA2-13B)的全面超越。
  • Skywork-13B-Math模型:顾名思义,这个模型在Base模型的基础上,针对数学解题和推理能力进行了专项强化训练,在GSM8K等数学数据集上取得了同规模下的最佳效果。

其次,是那个堪称“硬通货”的数据集——Skypile/Chinese-Web-Text-150B。该数据集从海量中文网页中经过精心过滤和清洗而来,规模约600GB,Token数量高达1500亿,是目前最大的开源中文数据集之一。开源如此高质量、大体量的预训练数据,意味着开发者不仅能“用”模型,还能更深入地“理解”和“定制”模型,借鉴其训练经验。

此外,昆仑万维还一并公开了模型评估方法、数据配比研究以及训练基础设施的调优方案。这一系列动作,显然意在推动整个开源社区对大模型预训练技术的共同认知与进步。

五大特点,勾勒出竞争力轮廓

综合来看,Skywork-13B系列模型主要凸显了五个方面的特点,这也构成了其核心竞争力的轮廓。

1. 性能表现强劲:在CEVAL、CMMLU等主流中文评测,以及MMLU、GSM8K等国际通用基准上,其综合得分全面超越了同规模的LLaMA2-13B等模型(截至10月25日数据)。

2. 训练数据充沛:模型基于3.2万亿高质量多语言Token训练而成,庞大的数据量为其生成、创作和推理能力打下了坚实基础。

3. 中文能力突出:这一点尤其关键。在针对不同领域中文文本的语言建模困惑度评测中,Skywork-13B在技术文章、政务报告、金融文本、游戏内容等多个垂直领域,都表现出了更低的困惑度(数值越低代表建模能力越强),这意味着它在处理专业中文内容时可能更加得心应手。

上图为不同领域数据下评估模型的困惑度,越低代表模型在该领域建模能力越强。结果显示天工13B在技术文章,电影,政务报告,游戏,金融,通用领域均表现出色

4. 配套资源开放:如前所述,开源的1500亿Token中文数据集,为社区研究和模型微调提供了宝贵的资源。

5. 商用政策友好:这可能是对开发者最直接的利好。模型采用极简授权流程,取消了行业、公司规模等常见限制,用户下载并同意协议后即可商用,无需经历繁琐的申请审批。

All in AGI:昆仑万维的战略拼图

此次大规模开源,并非昆仑万维在AI领域的孤立行动,而是其“All in AGI与AIGC”战略的一块关键拼图。回顾其今年的动作,这条路径清晰可见:

从4月发布“天工3.5”大模型并启动测试,到5月入选北京市首批通用人工智能产业创新伙伴;从8月推出国内首款AI搜索产品“天工AI搜索”,到9月引入国际顶尖AI专家颜水成教授加盟并控股AI芯片公司艾捷科芯。每一步都在夯实其从算力、算法到应用的全栈能力。

可以说,Skywork-13B系列的开源,既是技术实力的展示,也是生态构建的宣言。它降低了高质量中文大模型的商用门槛,旨在吸引更多开发者和企业加入其生态,共同探索AGI技术的落地场景。在AI技术飞速演进、生态竞争日趋激烈的当下,这种通过开源扩大影响力、汇聚创新力量的策略,无疑值得关注。

来源:https://www.leiphone.com/category/ai/uBY6MZxNUHXJWeCa.html

游乐网为非赢利性网站,所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系youleyoucom@outlook.com。

同类文章
更多
AI行业动态:百图生科智子引擎获投Anthropic发布Claude3.5

AI行业动态:百图生科智子引擎获投Anthropic发布Claude3.5

过去一周,AI领域资本与创新活跃。百图生科获战略投资,智子引擎等初创公司获融资。国内方面,B站开源Index-1 9B模型,月之暗面优化长文本处理,蔚来整合团队探索智能驾驶。国际层面,Anthropic发布Claude3 5Sonnet并免费开放,MIT与哈佛推出病理诊断AI,斯坦福发布开源人形机器人。同时,OpenAI前科学家Ilya创立专注AI安全的公司

时间:2026-05-16 07:32
智源研究院1500天坚持原始创新与大模型深度对话

智源研究院1500天坚持原始创新与大模型深度对话

面对AI技术差距,智源研究院坚持原始创新,战略转向覆盖多领域的“大模型全家桶”。在主流赛道推出低碳万亿模型Tele-FLM-1T,并研发原生多模态Emu3;在具身智能等前沿“无人区”达到世界水平,同时以FlagOS开源体系支撑生态发展,致力于攻克关键痛点。

时间:2026-05-16 07:32
魔形智能创始人徐凌杰获国际GPU高管加盟

魔形智能创始人徐凌杰获国际GPU高管加盟

前壁仞科技总裁徐凌杰于2024年6月创立上海魔形智能,专注大模型基础设施领域。公司定位为提供软硬件一体优化平台,旨在降低大模型使用成本,注册资本达1000万美元。徐凌杰拥有深厚的技术与商业背景,曾任职于阿里云及多家国际芯片企业。此外,一位国际头部GPU厂商的中国区高管也已加盟。

时间:2026-05-16 07:32
五大AI语言学习工具推荐:高效掌握外语的未来趋势

五大AI语言学习工具推荐:高效掌握外语的未来趋势

人工智能正深度变革语言学习,提供个性化高效工具。Trancy通过双语字幕和沉浸翻译将视频网页转为学习材料;多邻国以游戏化课程让学习趣味化;Langua凭借高级对话练习和实时反馈提升口语听力;Memrise利用间隔重复法巩固词汇记忆;Busuu则连接全球社区满足定制化需求。这些工具共同助力用户跨越语言障。

时间:2026-05-16 07:32
五款实用AI知识搜索引擎推荐智能搜索新体验

五款实用AI知识搜索引擎推荐智能搜索新体验

AI知识搜索引擎借助前沿技术,提升查询准确性与用户体验,能深入理解意图并提供精准答案。文中介绍了五款领先产品:PerplexityAI以对话式答案见长;DevvAI专注开发者需求;秘塔科技推出大众搜索与法律专用工具;ThinkAny利用RAG技术生成专业回答;KomoAI强调交互探索。它们通过智能模型与友好界面,让信息获取更直接高效。

时间:2026-05-16 07:31
热门专题
更多
刀塔传奇破解版无限钻石下载大全 刀塔传奇破解版无限钻石下载大全
洛克王国正式正版手游下载安装大全 洛克王国正式正版手游下载安装大全
思美人手游下载专区 思美人手游下载专区
好玩的阿拉德之怒游戏下载合集 好玩的阿拉德之怒游戏下载合集
不思议迷宫手游下载合集 不思议迷宫手游下载合集
百宝袋汉化组游戏最新合集 百宝袋汉化组游戏最新合集
jsk游戏合集30款游戏大全 jsk游戏合集30款游戏大全
宾果消消消原版下载大全 宾果消消消原版下载大全
  • 日榜
  • 周榜
  • 月榜
热门教程
更多
  • 游戏攻略
  • 安卓教程
  • 苹果教程
  • 电脑教程