当前位置: 首页
web3.0
PyTorch 1.2更新:三大领域库加速AI开发

PyTorch 1.2更新:三大领域库加速AI开发

热心网友 时间:2025-12-03
转载

PyTorch 社区迎来重大更新:1.2 版本及三大领域库齐发力

最安全的虚拟币交易平台推荐:

最近,PyTorch 社区迎来了一系列令人兴奋的更新,包括 PyTorch 1.2、torchvision 0.4、torchaudio 0.3 和 torchtext 0.4。这些新版本都进行了优化和改进,兼容性更强,使用起来也更加方便。PyTorch 官方发布了相关文章介绍了每个工具的更新细节。

PyTorch 1.2:生产应用更进一步

PyTorch 1.2 在生产应用方面向前迈出了一大步,并增加了一个改进的 TorchScript 环境。这些改进使得用户可以更容易地构建生产模型,扩展对导出 ONNX 格式模型的支持功能,并增强对 Transformers 模块的支持。

此外,用户对 TensorBoard 的使用也更便捷,现在只需输入代码 `from torch.utils.tensorboard import SummaryWriter`,即可开始使用。

ONNX EXPORT 改进

PyTorch 1.2 增加了对导出 ONNX Opset 版本 7(v1.2)、8(v1.3)、9(v1.4)和 10(v1.5)的全面支持。同时,还优化了常量折叠(constant folding)的传递,用以支持最新版本的 ONNX Opset 10。

ScriptModule 也有相应的改进,包括:支持多输出、张量工厂表、元组作为输入和输出。此外,用户现在可以设置个性化的标记来导出自定义操作,并在导出期间指定输入的动态大小。

NN.TRANSFORMER

PyTorch 1.2 包含一个标准的 nn.Transformer 模块,该模块完全依赖注意力机制来构建输入和输出之间的全局依赖关系;该模块的各个组件经过精心设计,可以独立使用。

DAPI 库更新:加速领域研究

PyTorch 域的库(如 torchvision、torchtext 和 torchaudio)提供了对常用数据集、模型和转换器的便捷访问,可用于快速创建最先进的基线模型。此外,它们还提供了常见代码抽象集,以减少用户可能不得不重复写入代码的麻烦。

围绕 PyTorch 出现了一个称为 DAP I(Domain API)的专业库生态系统,以简化许多领域中新算法和现有算法的开发过程。PyTorch 1.2 核心版本发布后,官方也发布了三个更新的 DAPI 库,用于支持文本、音频和视觉内容。

TORCHAUDIO 0.3:与 KALDI 兼容,新转换器

Torchaudio 专注于机器理解音频波形。它是一个 ML 库,提供相关的信号处理功能。它利用 PyTorch 的 GPU 为波形提供了许多工具和转换的支持,并使数据加载和标准化更容易、更易读。

Torchaudio 0.3.0 的重点是标准化和复数、转换(重采样)和两个新的函数(phase\_vocoder,ISTFT)、Kaldi 兼容性以及新的教程。

标准化

Torchaudio 的转换接口进行了更新,以便围绕以下词汇和约定进行标准化:假设张量具有通道作为第一维度,时间作为最后维度(适用时);这将使得它与 PyTorch 的大小一致。对于大小的名称,用前缀 n\_(例如「大小(n\_freq,n\_mel)的张量」)命名,而维度名称则不具有该前缀(例如「维度张量(通道,时间)」);并且所有变换和函数的输入现在首先要假定通道。

Kaldi 兼容性

Torchaudio 提供与 Kaldi 兼容的接口,以简化载入并减少用户对 Kaldi 代码的依赖性。现在有一个接口可用于 spectrogram,fbank 和 resample\_waveform。

新教程

官方发布了一个新的教程,演示用户如何使用 torchaudio 进行预处理波形;同时该教程也将介绍加载波形并对其应用一些可用转换的示例。

带有监督学习数据集的 TORCHTEXT 0.4

torchtext 的一个关键重点领域是提供有助于加速 NLP 研究的基本要素。其中包括轻松访问常用数据集和基本预处理流程,用以处理基于原始文本的数据。torchtext 0.4.0 版本包括一些热门的监督学习基线模型,这些模型都带有「one-command」的数据加载项。

新版本涵盖了几个用于监督学习的主流文本分类数据集,包括:AG\_NEWS、SogouNews、DBpedia、YelpReviewPolarity、YelpReviewFull、YahooAnswers、AmazonReviewPolarity、AmazonReviewFull。

支持视频的 TORCHVISION 0.4

视频现在是 torchvision 中的一员,并且 torchvision 可以支持视频的数据加载、数据集、预训练模型和变换。TORCHVISION 0.4 版本包括:用于读/写视频文件(包括音频)的高效 IO 源码,支持任意编码与任意格式;标准视频数据集,与 torch.utils.data.Dataset 和 torch.utils.data.DataLoader 兼容;基于 Kinetics-400 数据集构建的预训练模型,用于视频(包括训练脚本)的动作分类;用于训练用户自身视频模型的参考训练脚本。

torchvision 提供了一些实用程序类型的 API,比如:VideoClips,它通过创建一组视频中所有剪辑的索引,简化了在视频文件列表中枚举所有可能固定大小的剪辑的任务。它还允许用户能够为视频指定固定的帧速率。

来源:https://www.51wangming.com/qukuailian/qkl88150.html

游乐网为非赢利性网站,所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系youleyoucom@outlook.com。

同类文章
更多
三步告别加密信息焦虑:手把手教你搭建专属Web3信息源

三步告别加密信息焦虑:手把手教你搭建专属Web3信息源

如何构建自己的加密信息源?告别信息焦虑的三个步骤 身处信息爆炸的加密货币领域,你是否感觉每天被海量消息淹没,真假难辨,反而更焦虑了?问题的核心,往往不在于信息太少,而在于缺乏一个有效的“过滤器”。构建一套专属的加密信息源体系,恰恰是减少噪音干扰、提升决策效率的关键解药。 这里先分享几个主流交易平台的

时间:2026-05-26 16:25
供给区与需求区详解:和传统支撑阻力位的核心区别

供给区与需求区详解:和传统支撑阻力位的核心区别

供给区与需求区深度解析:超越传统支撑阻力的高阶交易思维 在加密货币与Web3资产交易中,精准识别市场转折点是每个交易者的核心追求。供给区与需求区,作为基于市场微观结构的技术分析工具,正受到越来越多资深交易者的重视。它们不仅揭示了价格可能反转的区域,更深刻反映了链上大资金与市场情绪的博弈战场。 一、核

时间:2026-05-26 16:23
模块化区块链架构解析:与单体链的核心差异及优势

模块化区块链架构解析:与单体链的核心差异及优势

模块化区块链将传统单体链的功能分解为数据可用性、共识与执行等层级,通过解耦核心组件提升可扩展性与灵活性,使网络可专注于特定功能。相比之下,单体链整合所有功能于单一层级,简化设计但限制了定制与扩展潜力。模块化方案通过分工协作优化了整体性能与效率。

时间:2026-05-26 16:21
火币量化交易设置教程 从入门到精通指南

火币量化交易设置教程 从入门到精通指南

本文介绍了在火币交易所进行量化交易的基本设置流程。内容涵盖从策略选择、API密钥安全配置,到使用内置工具或第三方平台连接交易所,再到参数优化与风险控制等关键环节。旨在为有意尝试自动化交易的用户提供一个清晰、实用的入门指引,帮助其理解量化交易的核心步骤与注意事项。

时间:2026-05-26 16:18
加密资产证券属性解析为何成为全球监管核心议题

加密资产证券属性解析为何成为全球监管核心议题

加密资产证券属性深度解析:监管核心与合规指南 在快速演进的Web3世界中,“证券属性”已成为决定加密资产法律命运与市场生存空间的关键标尺。这并非单纯的技术分类,而是将去中心化金融产品置于传统金融监管框架下审视的法律定性。一旦被认定为证券,项目将面临最严格的发行、披露与交易合规要求,其运营逻辑与市场准

时间:2026-05-26 16:16
热门专题
更多
刀塔传奇破解版无限钻石下载大全 刀塔传奇破解版无限钻石下载大全
洛克王国正式正版手游下载安装大全 洛克王国正式正版手游下载安装大全
思美人手游下载专区 思美人手游下载专区
好玩的阿拉德之怒游戏下载合集 好玩的阿拉德之怒游戏下载合集
不思议迷宫手游下载合集 不思议迷宫手游下载合集
百宝袋汉化组游戏最新合集 百宝袋汉化组游戏最新合集
jsk游戏合集30款游戏大全 jsk游戏合集30款游戏大全
宾果消消消原版下载大全 宾果消消消原版下载大全
  • 日榜
  • 周榜
  • 月榜
热门教程
更多
  • 游戏攻略
  • 安卓教程
  • 苹果教程
  • 电脑教程