PyTorch 1.2更新:三大领域库加速AI开发
PyTorch 社区迎来重大更新:1.2 版本及三大领域库齐发力
最安全的虚拟币交易平台推荐:
- OKX(欧易交易所)>>>进入官网<<< >>>官方下载<<<
- Binance(币安交易所)>>>进入官网<<< >>>官方下载<<<
最近,PyTorch 社区迎来了一系列令人兴奋的更新,包括 PyTorch 1.2、torchvision 0.4、torchaudio 0.3 和 torchtext 0.4。这些新版本都进行了优化和改进,兼容性更强,使用起来也更加方便。PyTorch 官方发布了相关文章介绍了每个工具的更新细节。
PyTorch 1.2:生产应用更进一步
PyTorch 1.2 在生产应用方面向前迈出了一大步,并增加了一个改进的 TorchScript 环境。这些改进使得用户可以更容易地构建生产模型,扩展对导出 ONNX 格式模型的支持功能,并增强对 Transformers 模块的支持。
此外,用户对 TensorBoard 的使用也更便捷,现在只需输入代码 `from torch.utils.tensorboard import SummaryWriter`,即可开始使用。
ONNX EXPORT 改进
PyTorch 1.2 增加了对导出 ONNX Opset 版本 7(v1.2)、8(v1.3)、9(v1.4)和 10(v1.5)的全面支持。同时,还优化了常量折叠(constant folding)的传递,用以支持最新版本的 ONNX Opset 10。
ScriptModule 也有相应的改进,包括:支持多输出、张量工厂表、元组作为输入和输出。此外,用户现在可以设置个性化的标记来导出自定义操作,并在导出期间指定输入的动态大小。
NN.TRANSFORMER
PyTorch 1.2 包含一个标准的 nn.Transformer 模块,该模块完全依赖注意力机制来构建输入和输出之间的全局依赖关系;该模块的各个组件经过精心设计,可以独立使用。
DAPI 库更新:加速领域研究
PyTorch 域的库(如 torchvision、torchtext 和 torchaudio)提供了对常用数据集、模型和转换器的便捷访问,可用于快速创建最先进的基线模型。此外,它们还提供了常见代码抽象集,以减少用户可能不得不重复写入代码的麻烦。
围绕 PyTorch 出现了一个称为 DAP I(Domain API)的专业库生态系统,以简化许多领域中新算法和现有算法的开发过程。PyTorch 1.2 核心版本发布后,官方也发布了三个更新的 DAPI 库,用于支持文本、音频和视觉内容。
TORCHAUDIO 0.3:与 KALDI 兼容,新转换器
Torchaudio 专注于机器理解音频波形。它是一个 ML 库,提供相关的信号处理功能。它利用 PyTorch 的 GPU 为波形提供了许多工具和转换的支持,并使数据加载和标准化更容易、更易读。
Torchaudio 0.3.0 的重点是标准化和复数、转换(重采样)和两个新的函数(phase\_vocoder,ISTFT)、Kaldi 兼容性以及新的教程。
标准化
Torchaudio 的转换接口进行了更新,以便围绕以下词汇和约定进行标准化:假设张量具有通道作为第一维度,时间作为最后维度(适用时);这将使得它与 PyTorch 的大小一致。对于大小的名称,用前缀 n\_(例如「大小(n\_freq,n\_mel)的张量」)命名,而维度名称则不具有该前缀(例如「维度张量(通道,时间)」);并且所有变换和函数的输入现在首先要假定通道。
Kaldi 兼容性
Torchaudio 提供与 Kaldi 兼容的接口,以简化载入并减少用户对 Kaldi 代码的依赖性。现在有一个接口可用于 spectrogram,fbank 和 resample\_waveform。
新教程
官方发布了一个新的教程,演示用户如何使用 torchaudio 进行预处理波形;同时该教程也将介绍加载波形并对其应用一些可用转换的示例。
带有监督学习数据集的 TORCHTEXT 0.4
torchtext 的一个关键重点领域是提供有助于加速 NLP 研究的基本要素。其中包括轻松访问常用数据集和基本预处理流程,用以处理基于原始文本的数据。torchtext 0.4.0 版本包括一些热门的监督学习基线模型,这些模型都带有「one-command」的数据加载项。
新版本涵盖了几个用于监督学习的主流文本分类数据集,包括:AG\_NEWS、SogouNews、DBpedia、YelpReviewPolarity、YelpReviewFull、YahooAnswers、AmazonReviewPolarity、AmazonReviewFull。
支持视频的 TORCHVISION 0.4
视频现在是 torchvision 中的一员,并且 torchvision 可以支持视频的数据加载、数据集、预训练模型和变换。TORCHVISION 0.4 版本包括:用于读/写视频文件(包括音频)的高效 IO 源码,支持任意编码与任意格式;标准视频数据集,与 torch.utils.data.Dataset 和 torch.utils.data.DataLoader 兼容;基于 Kinetics-400 数据集构建的预训练模型,用于视频(包括训练脚本)的动作分类;用于训练用户自身视频模型的参考训练脚本。
torchvision 提供了一些实用程序类型的 API,比如:VideoClips,它通过创建一组视频中所有剪辑的索引,简化了在视频文件列表中枚举所有可能固定大小的剪辑的任务。它还允许用户能够为视频指定固定的帧速率。
游乐网为非赢利性网站,所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系youleyoucom@outlook.com。
同类文章
三步告别加密信息焦虑:手把手教你搭建专属Web3信息源
如何构建自己的加密信息源?告别信息焦虑的三个步骤 身处信息爆炸的加密货币领域,你是否感觉每天被海量消息淹没,真假难辨,反而更焦虑了?问题的核心,往往不在于信息太少,而在于缺乏一个有效的“过滤器”。构建一套专属的加密信息源体系,恰恰是减少噪音干扰、提升决策效率的关键解药。 这里先分享几个主流交易平台的
供给区与需求区详解:和传统支撑阻力位的核心区别
供给区与需求区深度解析:超越传统支撑阻力的高阶交易思维 在加密货币与Web3资产交易中,精准识别市场转折点是每个交易者的核心追求。供给区与需求区,作为基于市场微观结构的技术分析工具,正受到越来越多资深交易者的重视。它们不仅揭示了价格可能反转的区域,更深刻反映了链上大资金与市场情绪的博弈战场。 一、核
模块化区块链架构解析:与单体链的核心差异及优势
模块化区块链将传统单体链的功能分解为数据可用性、共识与执行等层级,通过解耦核心组件提升可扩展性与灵活性,使网络可专注于特定功能。相比之下,单体链整合所有功能于单一层级,简化设计但限制了定制与扩展潜力。模块化方案通过分工协作优化了整体性能与效率。
火币量化交易设置教程 从入门到精通指南
本文介绍了在火币交易所进行量化交易的基本设置流程。内容涵盖从策略选择、API密钥安全配置,到使用内置工具或第三方平台连接交易所,再到参数优化与风险控制等关键环节。旨在为有意尝试自动化交易的用户提供一个清晰、实用的入门指引,帮助其理解量化交易的核心步骤与注意事项。
加密资产证券属性解析为何成为全球监管核心议题
加密资产证券属性深度解析:监管核心与合规指南 在快速演进的Web3世界中,“证券属性”已成为决定加密资产法律命运与市场生存空间的关键标尺。这并非单纯的技术分类,而是将去中心化金融产品置于传统金融监管框架下审视的法律定性。一旦被认定为证券,项目将面临最严格的发行、披露与交易合规要求,其运营逻辑与市场准
- 日榜
- 周榜
- 月榜
1
2
3
4
5
6
7
8
9
10
相关攻略
2015-03-10 11:25
2015-03-10 11:05
2021-08-04 13:30
2015-03-10 11:22
2015-03-10 12:39
2022-05-16 18:57
2025-05-23 13:43
2025-05-23 14:01
热门教程
- 游戏攻略
- 安卓教程
- 苹果教程
- 电脑教程
热门话题

