PyTorch 1.2更新:三大领域库加速AI开发

PyTorch 社区迎来重大更新:1.2 版本及三大领域库齐发力
最安全的虚拟币交易平台推荐:
- OKX(欧易交易所)>>>进入官网<<< >>>官方下载<<<
- Binance(币安交易所)>>>进入官网<<< >>>官方下载<<<
最近,PyTorch 社区迎来了一系列令人兴奋的更新,包括 PyTorch 1.2、torchvision 0.4、torchaudio 0.3 和 torchtext 0.4。这些新版本都进行了优化和改进,兼容性更强,使用起来也更加方便。PyTorch 官方发布了相关文章介绍了每个工具的更新细节。
PyTorch 1.2:生产应用更进一步
PyTorch 1.2 在生产应用方面向前迈出了一大步,并增加了一个改进的 TorchScript 环境。这些改进使得用户可以更容易地构建生产模型,扩展对导出 ONNX 格式模型的支持功能,并增强对 Transformers 模块的支持。
此外,用户对 TensorBoard 的使用也更便捷,现在只需输入代码 `from torch.utils.tensorboard import SummaryWriter`,即可开始使用。
ONNX EXPORT 改进
PyTorch 1.2 增加了对导出 ONNX Opset 版本 7(v1.2)、8(v1.3)、9(v1.4)和 10(v1.5)的全面支持。同时,还优化了常量折叠(constant folding)的传递,用以支持最新版本的 ONNX Opset 10。
ScriptModule 也有相应的改进,包括:支持多输出、张量工厂表、元组作为输入和输出。此外,用户现在可以设置个性化的标记来导出自定义操作,并在导出期间指定输入的动态大小。
NN.TRANSFORMER
PyTorch 1.2 包含一个标准的 nn.Transformer 模块,该模块完全依赖注意力机制来构建输入和输出之间的全局依赖关系;该模块的各个组件经过精心设计,可以独立使用。
DAPI 库更新:加速领域研究
PyTorch 域的库(如 torchvision、torchtext 和 torchaudio)提供了对常用数据集、模型和转换器的便捷访问,可用于快速创建最先进的基线模型。此外,它们还提供了常见代码抽象集,以减少用户可能不得不重复写入代码的麻烦。
围绕 PyTorch 出现了一个称为 DAP I(Domain API)的专业库生态系统,以简化许多领域中新算法和现有算法的开发过程。PyTorch 1.2 核心版本发布后,官方也发布了三个更新的 DAPI 库,用于支持文本、音频和视觉内容。
TORCHAUDIO 0.3:与 KALDI 兼容,新转换器
Torchaudio 专注于机器理解音频波形。它是一个 ML 库,提供相关的信号处理功能。它利用 PyTorch 的 GPU 为波形提供了许多工具和转换的支持,并使数据加载和标准化更容易、更易读。
Torchaudio 0.3.0 的重点是标准化和复数、转换(重采样)和两个新的函数(phase\_vocoder,ISTFT)、Kaldi 兼容性以及新的教程。
标准化
Torchaudio 的转换接口进行了更新,以便围绕以下词汇和约定进行标准化:假设张量具有通道作为第一维度,时间作为最后维度(适用时);这将使得它与 PyTorch 的大小一致。对于大小的名称,用前缀 n\_(例如「大小(n\_freq,n\_mel)的张量」)命名,而维度名称则不具有该前缀(例如「维度张量(通道,时间)」);并且所有变换和函数的输入现在首先要假定通道。
Kaldi 兼容性
Torchaudio 提供与 Kaldi 兼容的接口,以简化载入并减少用户对 Kaldi 代码的依赖性。现在有一个接口可用于 spectrogram,fbank 和 resample\_waveform。
新教程
官方发布了一个新的教程,演示用户如何使用 torchaudio 进行预处理波形;同时该教程也将介绍加载波形并对其应用一些可用转换的示例。
带有监督学习数据集的 TORCHTEXT 0.4
torchtext 的一个关键重点领域是提供有助于加速 NLP 研究的基本要素。其中包括轻松访问常用数据集和基本预处理流程,用以处理基于原始文本的数据。torchtext 0.4.0 版本包括一些热门的监督学习基线模型,这些模型都带有「one-command」的数据加载项。
新版本涵盖了几个用于监督学习的主流文本分类数据集,包括:AG\_NEWS、SogouNews、DBpedia、YelpReviewPolarity、YelpReviewFull、YahooAnswers、AmazonReviewPolarity、AmazonReviewFull。
支持视频的 TORCHVISION 0.4
视频现在是 torchvision 中的一员,并且 torchvision 可以支持视频的数据加载、数据集、预训练模型和变换。TORCHVISION 0.4 版本包括:用于读/写视频文件(包括音频)的高效 IO 源码,支持任意编码与任意格式;标准视频数据集,与 torch.utils.data.Dataset 和 torch.utils.data.DataLoader 兼容;基于 Kinetics-400 数据集构建的预训练模型,用于视频(包括训练脚本)的动作分类;用于训练用户自身视频模型的参考训练脚本。
torchvision 提供了一些实用程序类型的 API,比如:VideoClips,它通过创建一组视频中所有剪辑的索引,简化了在视频文件列表中枚举所有可能固定大小的剪辑的任务。它还允许用户能够为视频指定固定的帧速率。
免责声明
游乐网为非赢利性网站,所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系youleyoucom@outlook.com。
同类文章
2025年2月加密货币空投指南:排名前5潜力项目
我们将介绍五大顶级项目:Axlflops Network ($AIGT)、KungFu Kitty ($FUKIT)、SoyjakAI ($SOY)、Mantra Network ($MANTRA) 和 Project Merlin ($MRLN),让我们深入了解这些空投的特别之处以及您可以如何参与其中
KAITO币空投领取指南:轻松获取空投资格与策略教学
Kaito是一个新一代的web3搜寻引擎,由先进的AI 提供支持,KAITO是Kaito的原生加密货币,KAITO 币将成为用户通往资讯、注意力和资本分布中心的钥匙,那么,KAITO币空投如何领取?下文将为大家详解KAITO币领空投攻略教学
币安注销账号教学:未输入推荐码怎么办?
币安是全球最大的加密货币交易平台,受到加密货币爱好者的青睐,中国大陆地区的用户目前可以在币安平台上进行交易,但很多投资者在注册币安账号的时候忘记输入邀请码 推荐吗,那么,推荐码没输入怎么办?当然需要删除帐号重新注册了,下文将为大家详解币安注销帐号教学
OpenSea重返NFT之巅!发币效应引爆交易量暴增近5倍
曾一度被竞争对手压制的Opensea,如今以「逆袭」之姿重返NFT市场巅峰,过去一周来,OpenSea在以太坊NFT市场的交易量占有率狂飙至71 5%,相较4周前仅25 5%,成长幅度惊人, 更多详细资讯请看下面正文
热门推荐
热门教程
更多- 游戏攻略
- 安卓教程
- 苹果教程
- 电脑教程








