PyTorch 1.2更新:三大领域库加速AI开发
PyTorch 社区迎来重大更新:1.2 版本及三大领域库齐发力
2025年主流加密货币交易所:
- 欧易OKX >>>进入官网<<< >>>官方下载<<<
- 币安Binance >>>进入官网<<< >>>官方下载<<<
最近,PyTorch 社区迎来了一系列令人兴奋的更新,包括 PyTorch 1.2、torchvision 0.4、torchaudio 0.3 和 torchtext 0.4。这些新版本都进行了优化和改进,兼容性更强,使用起来也更加方便。PyTorch 官方发布了相关文章介绍了每个工具的更新细节。
PyTorch 1.2:生产应用更进一步
PyTorch 1.2 在生产应用方面向前迈出了一大步,并增加了一个改进的 TorchScript 环境。这些改进使得用户可以更容易地构建生产模型,扩展对导出 ONNX 格式模型的支持功能,并增强对 Transformers 模块的支持。
此外,用户对 TensorBoard 的使用也更便捷,现在只需输入代码 `from torch.utils.tensorboard import SummaryWriter`,即可开始使用。
ONNX EXPORT 改进
PyTorch 1.2 增加了对导出 ONNX Opset 版本 7(v1.2)、8(v1.3)、9(v1.4)和 10(v1.5)的全面支持。同时,还优化了常量折叠(constant folding)的传递,用以支持最新版本的 ONNX Opset 10。
ScriptModule 也有相应的改进,包括:支持多输出、张量工厂表、元组作为输入和输出。此外,用户现在可以设置个性化的标记来导出自定义操作,并在导出期间指定输入的动态大小。
NN.TRANSFORMER
PyTorch 1.2 包含一个标准的 nn.Transformer 模块,该模块完全依赖注意力机制来构建输入和输出之间的全局依赖关系;该模块的各个组件经过精心设计,可以独立使用。
DAPI 库更新:加速领域研究
PyTorch 域的库(如 torchvision、torchtext 和 torchaudio)提供了对常用数据集、模型和转换器的便捷访问,可用于快速创建最先进的基线模型。此外,它们还提供了常见代码抽象集,以减少用户可能不得不重复写入代码的麻烦。
围绕 PyTorch 出现了一个称为 DAP I(Domain API)的专业库生态系统,以简化许多领域中新算法和现有算法的开发过程。PyTorch 1.2 核心版本发布后,官方也发布了三个更新的 DAPI 库,用于支持文本、音频和视觉内容。
TORCHAUDIO 0.3:与 KALDI 兼容,新转换器
Torchaudio 专注于机器理解音频波形。它是一个 ML 库,提供相关的信号处理功能。它利用 PyTorch 的 GPU 为波形提供了许多工具和转换的支持,并使数据加载和标准化更容易、更易读。
Torchaudio 0.3.0 的重点是标准化和复数、转换(重采样)和两个新的函数(phase\_vocoder,ISTFT)、Kaldi 兼容性以及新的教程。
标准化
Torchaudio 的转换接口进行了更新,以便围绕以下词汇和约定进行标准化:假设张量具有通道作为第一维度,时间作为最后维度(适用时);这将使得它与 PyTorch 的大小一致。对于大小的名称,用前缀 n\_(例如「大小(n\_freq,n\_mel)的张量」)命名,而维度名称则不具有该前缀(例如「维度张量(通道,时间)」);并且所有变换和函数的输入现在首先要假定通道。
Kaldi 兼容性
Torchaudio 提供与 Kaldi 兼容的接口,以简化载入并减少用户对 Kaldi 代码的依赖性。现在有一个接口可用于 spectrogram,fbank 和 resample\_waveform。
新教程
官方发布了一个新的教程,演示用户如何使用 torchaudio 进行预处理波形;同时该教程也将介绍加载波形并对其应用一些可用转换的示例。
带有监督学习数据集的 TORCHTEXT 0.4
torchtext 的一个关键重点领域是提供有助于加速 NLP 研究的基本要素。其中包括轻松访问常用数据集和基本预处理流程,用以处理基于原始文本的数据。torchtext 0.4.0 版本包括一些热门的监督学习基线模型,这些模型都带有「one-command」的数据加载项。
新版本涵盖了几个用于监督学习的主流文本分类数据集,包括:AG\_NEWS、SogouNews、DBpedia、YelpReviewPolarity、YelpReviewFull、YahooAnswers、AmazonReviewPolarity、AmazonReviewFull。
支持视频的 TORCHVISION 0.4
视频现在是 torchvision 中的一员,并且 torchvision 可以支持视频的数据加载、数据集、预训练模型和变换。TORCHVISION 0.4 版本包括:用于读/写视频文件(包括音频)的高效 IO 源码,支持任意编码与任意格式;标准视频数据集,与 torch.utils.data.Dataset 和 torch.utils.data.DataLoader 兼容;基于 Kinetics-400 数据集构建的预训练模型,用于视频(包括训练脚本)的动作分类;用于训练用户自身视频模型的参考训练脚本。
torchvision 提供了一些实用程序类型的 API,比如:VideoClips,它通过创建一组视频中所有剪辑的索引,简化了在视频文件列表中枚举所有可能固定大小的剪辑的任务。它还允许用户能够为视频指定固定的帧速率。
游乐网为非赢利性网站,所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系youleyoucom@outlook.com。
同类文章
全链网下调年末黄金价格预测至每盎司5200美元
全链网报道,6月12日,市场迎来一则来自澳新银&行的调价动作——该行将年末黄金价格的预测,从之前的每盎司5600美元,下调至5200美元。调整的触发因素,说穿了就是近期黄金价格的实际走势。这年头,预测要跟上市场的节奏,不调整可不行。
比特币7日平均交易笔数逼近70万,接近历史峰值
六月十二日数据显示,比特币过去七日日均交易笔数达七十万零四百六十四笔,逼近历史最高点。该指标反映网络实际使用活跃度,表明链上生态正在升温,包括转账、去中心化金融交互及序数相关操作。
期现套利稳赚资金费率 欧易机器人参数设置图解
在统一账户下建立反向且名义价值相等的现货杠杆多单与永续合约空单,资金费率需为正且不低于0 012%。计算净收益大于0 003%即可套利。建仓可用手动或模板,设置机器人参数如触发线0 008%、平仓阈值0 002%,开启动态再平衡,关闭价格止损。
月12日午间Web3加密市场动态汇总
比特币链上活跃度逼近历史峰值,日均交易量达70万笔。贝索斯旗下AI公司Prometheus完成120亿美元B轮融资。Coinbase呼吁启动抗量子迁移。美财长表示或动用伊朗冻结资产补偿海湾国家。芝商所拟推出24小时原油黄金合约。《财富》发布Crypto100榜单。Strategy创始人澄清未禁止出售比特币。
OKX账户风控冻结解封指南 客服申诉通道正确用法
账户因风控被冻结时,应通过OKX官方申诉通道解封。先确认冻结类型,区分司法冻结。准备身份与资产证明、交易行为说明及辅助材料,通过客服获取短信验证码后提交工单,等待14个工作日回复。
- 日榜
- 周榜
- 月榜
1
2
3
4
5
6
7
8
9
10
1
2
3
4
5
6
7
8
9
10
相关攻略
2026-06-12 12:57
2026-06-12 12:55
2026-06-12 12:52
2026-06-12 12:48
2026-06-12 12:45
2026-06-12 12:42
2026-06-12 12:40
2026-06-12 12:38
热门教程
- 游戏攻略
- 安卓教程
- 苹果教程
- 电脑教程
热门话题

