天工Skywork-13B系列开源模型详解与应用指南

数码系统

相机 win10

测评 win11

手机智车

华为 Tesla

小米理想

苹果蔚来

游戏软件

LOL 抖音

原神微信

当前位置：首页

天工Skywork-13B系列开源模型详解与应用指南

热心网友时间：2026-05-18

转载

10月底，国内AI开源社区迎来了一记重磅消息。昆仑万维正式开源了其百亿级大语言模型「天工」Skywork-13B系列。更引人注目的是，这次开源并非“挤牙膏”，而是罕见地配套放出了高达600GB、包含1500亿Token的超大规模高质量中文数据集。这一组合拳，无疑为国内大模型开发者社区投下了一颗“深水冲击波”。

此次开源的Skywork-13B系列包含两个130亿参数的模型：通用基础模型Skywork-13B-Base和经过专门强化的Skywork-13B-Math数学模型。从已公布的评测数据看，它们在CEVAL、GSM8K等多个权威基准测试中，都展现出了同规模模型中的领先性能，尤其是在中文科技、金融、政务等垂直领域的表现，明显优于其他开源竞品。

当然，模型本身只是故事的一部分。真正让这次开源显得诚意十足的，是那份名为Skypile/Chinese-Web-Text-150B的中文语料数据集。600GB的体积、1500亿Token的规模，让它跻身目前最大的开源中文数据集行列。这相当于不仅给了你一辆性能出色的赛车，还把制造这辆赛车的核心图纸和优质燃料也一并公开了。

更重要的是，昆仑万维宣布，Skywork-13B系列将全面开放商用。开发者无需经历繁琐的申请流程，即可在遵守相关协议的前提下直接用于商业场景。这彻底扫清了开源模型在落地应用时最大的合规障碍。

综合来看，130亿参数、两大专项模型、顶级中文数据集、加上无门槛商用许可，这套组合让Skywork-13B系列堪称当前业内“开源最彻底”的百亿参数级商用模型。其意义不仅在于提供了一个强大的工具，更在于大幅降低了高质量大模型的商业应用门槛，为AI技术真正渗透到千行百业铺平了道路。

两大模型领先行业

我们来具体拆解一下这次开源的核心资产。

首先是Skywork-13B-Base基础模型。它经过了3.2万亿个多语言高质量Token的预训练，在CEVAL、CMMLU、MMLU等综合评测中，性能超越了同参数的LLaMA2-13B等知名开源模型。而Skywork-13B-Math模型则针对数学推理能力进行了专项优化，在GSM8K等数学解题数据集上表现突出。

其次，便是前面提到的Skypile/Chinese-Web-Text-150B数据集。该数据集从海量中文网页中经过精心清洗和过滤而得，质量极高。开源如此大规模的高质量中文语料，在国内尚属首次，这为后续研究者训练或微调自己的模型提供了宝贵的数据基础。

此外，昆仑万维还同步公开了模型训练中的评估方法、数据配比研究乃至基础设施调优方案。这一系列“开源全家桶”，目的很明确：不只是为了展示成果，更是希望推动整个社区对大模型预训练技术的认知，共同向通用人工智能（AGI）的目标迈进。

五大特点全面超越

为什么说Skywork-13B系列值得关注？我们可以从五个关键维度来看。

最强参数表现：全面超越同等规模大模型

根据截至10月25日的评测数据，Skywork-13B系列在CEVAL、CMMLU、MMLU、GSM8K等主流基准测试中，全面领先于其他同规模开源模型，确立了其性能标杆的地位。

最多训练数据：3.2T高质量的多语言训练数据

模型性能的根基在于数据。Skywork-13B基于3.2万亿Token的多语言高质量数据进行训练，庞大的数据量为其出色的生成、创作和数学推理能力打下了坚实基础。

最强中文语言建模能力：中文语言建模困惑度评测，超越所有中文开源模型

对于中文场景而言，本土化能力至关重要。Skywork-13B在中文语言建模的困惑度评测中表现优异，这意味着它在理解和生成中文文本方面更为精准。特别是在科技、金融、政务、文创等专业领域，其表现均优于业内其他开源模型。

上图展示了模型在不同领域数据下的困惑度评估结果（数值越低能力越强）。可以看到，天工13B在技术文章、政务报告、金融文本等多个关键领域都展现出了显著优势。

最大中文开源数据集之一：150B Tokens高质量中文语料

配套开源的1500亿Token中文数据集，是本次开源的另一大亮点。它不仅是资源馈赠，更是一份珍贵的研究样本。开发者可以借此深入理解大模型预训练的数据处理逻辑，从而更有针对性地进行模型定制和优化。

最有诚意的开源商用：无需申请，即可实现商用

这一点或许对开发者最为友好。目前，许多开源模型在商用授权上设置了不少门槛，比如复杂的申请流程，甚至对公司规模、行业有所限制。Skywork-13B系列则采取了极简策略：开发者下载模型并同意社区许可协议后，即可直接商用，无需额外申请。这极大地释放了模型的商业潜能，让更多中小企业和个人开发者能够无障碍地探索AI应用的无限可能。

可以说，昆仑万维此举意在构建一个更加繁荣的开源生态，通过降低技术获取和使用的成本，吸引更多力量共同参与这场由AI驱动的科技变革。