HDFS快照如何使用
HDFS 快照使用指南

免费影视、动漫、音乐、游戏、小说资源长期稳定更新! 👉 点此立即查看 👈
说到数据备份与恢复,HDFS快照绝对是一个高效且轻量的利器。它本质上就是文件系统在某个特定时刻的“只读照片”,专门用于应对误操作或进行历史状态对比。那么,它到底是怎么工作的?简单来说,有以下几个核心特性:
一 核心概念与适用场景
首先,HDFS快照的创建几乎是瞬间完成的,时间复杂度为O(1),这意味着它不涉及大规模的数据复制。其次,它非常节省资源:只有在修改与快照相关的数据时,才会占用额外的内存,开销与被修改的文件或目录数量成正比。最关键的是,快照并不复制实际的DataNode数据块,它只记录文件的元数据信息,比如块列表和文件大小。因此,日常的HDFS读写操作完全不受影响,所有修改都会按时间倒序记录,你可以直接访问到最新的数据。
这种机制决定了它的典型用武之地:为重要目录创建时间点备份、快速恢复误删除的文件、对比不同时间点的数据变更,以及满足审计需求。
二 前置条件与限制
在使用快照前,有几个关键限制必须了解。目录不是天生就能拍快照的,需要先被管理员设置为“可快照目录”。一个这样的目录最多能保存65,536个快照,不过系统中可快照目录的总数没有限制。
这里有个重要的“禁止级联”规则:如果一个目录的父目录或子目录已经是可快照目录,那么它本身就不能再被设置为可快照了。此外,对于可快照目录,在删除其下的所有快照之前,你既不能删除也不能重命名这个目录。
访问快照的路径也有一套固定格式,使用/.snapshot这个保留后缀。举个例子,如果/foo是可快照目录并且有一个快照s0,那么/foo/.snapshot/s0/bar指向的就是/foo/bar文件在s0那个时刻的状态。
三 常用命令速查
为了方便查阅,这里将常用命令按角色和用途归类:
管理员操作(需超级用户权限)
- 允许目录创建快照:
hdfs dfsadmin -allowSnapshot - 禁止目录创建快照:
hdfs dfsadmin -disallowSnapshot(执行前需先删除该目录下全部快照)
用户操作
- 创建快照:
hdfs dfs -createSnapshot(如果省略快照名称,系统会自动生成一个带时间戳的名字,格式如 sYYYYMMDD-HHmmss.SSS)[snapshotName] - 删除快照:
hdfs dfs -deleteSnapshot - 重命名快照:
hdfs dfs -renameSnapshot - 列出所有可快照目录:
hdfs lsSnapshottableDir - 比较两个快照间的差异:
hdfs snapshotDiff(这里可以用.来表示当前目录的最新状态)
快照访问与恢复
- 列出某个快照的内容:
hdfs dfs -ls/.snapshot/ - 从快照拷贝文件进行恢复:
hdfs dfs -cp -ptopax(注意/.snapshot/ / -ptopax参数,它能保留文件的时间戳、属主、权限、ACL和扩展属性)
四 完整示例:备份与恢复
光看命令可能有点抽象,我们通过一个完整的场景来串联一下:
- 开启快照功能:首先,管理员为重要目录开启权限。
hdfs dfsadmin -allowSnapshot /data/important - 创建快照:然后,用户创建一个命名清晰的快照作为备份点。
hdfs dfs -createSnapshot /data/important backup_20251214 - 误删后恢复:假设不小心删除了目录里的
conf文件夹,可以从快照中完整恢复。hdfs dfs -rm -r /data/important/confhdfs dfs -cp -ptopax /data/important/.snapshot/backup_20251214/conf /data/important/ - 对比变更:恢复后,可以对比一下快照和当前状态的差异,看看除了删除还发生了什么。
hdfs snapshotDiff /data/important backup_20251214 . - 清理与关闭:最后,如果需要释放资源,删除快照并关闭该目录的快照功能。
hdfs dfs -deleteSnapshot /data/important backup_20251214hdfs dfsadmin -disallowSnapshot /data/important
需要留意的是snapshotDiff命令输出的符号含义:+表示文件被创建,-表示被删除,M表示被修改,R表示在同一个可快照目录内被重命名。如果文件被重命名到了目录外,则会被分别报告为删除和创建。
五 在 OSS-HDFS 中使用快照
对于使用阿里云OSS-HDFS服务的用户来说,好消息是快照功能基本兼容。用法和原生HDFS大体一致,但开启和关闭快照需要使用JindoSDK提供的管理命令:
- 开启:
jindo admin -allowSnapshot -dlsUri oss://. / - 创建:
hdfs dfs -createSnapshot oss://. / - 访问:
hdfs dfs -ls oss://. / /.snapshot/ / - 恢复:
hdfs dfs -cp oss://. / /.snapshot/ / oss:// . / - 差异对比:
jindo admin -snapshotDiff -dlsUri oss://. / -fromSnapshot -toSnapshot - 关闭:
jindo admin -disallowSnapshot -dlsUri oss://(同样,需要先删除该路径下的全部快照). /
在使用前,请确保你的JindoData版本在4.0.0及以上。部分生产环境建议使用JindoSDK 4.5.0及以上版本,并正确配置AccessKey和Endpoint。
游乐网为非赢利性网站,所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系youleyoucom@outlook.com。
同类文章
VSCode集成终端字体_解决终端中Icon图标显示乱码
终端图标显示为方块或问号,本质是字体不支持连字或 Nerd Font 图标集 你是不是也遇到过这种情况?在 VSCode 的集成终端里,无论是执行 ls 命令,还是查看 git status,甚至是 Oh My Zsh 主题里那些酷炫的图标,最后显示出来的却是一堆令人困惑的方块、问号,或者干脆是空白
Sublime配置Unity着色器Shader开发环境_内置语法高亮与属性补全
Sublime 打开 shader 文件没颜色,须先安装 Package Control 插件管理器,再安装 Unity-Shader 插件并手动关联语法;补全功能需配置 Shader_path 指向 Unity 的 CGIncludes 目录。 Sublime 打开 shader 文件没颜色?
Sublime Text如何打开最近的文件和项目_Sublime打开最近文件与项目思路
Sublime Text如何打开最近的文件和项目 很多 Sublime Text 用户都遇到过这样的困惑:想快速找回刚才编辑的文件,或者切换到另一个项目,按了几个快捷键却发现结果和预期不一样。这背后其实有个关键点:Sublime Text 并没有一个统一的“最近文件+项目”面板,而是把这两件事拆开处
Sublime怎么设置编辑器流畅度?Sublime性能优化与缓存清理
Sublime Text卡顿主因是索引错乱、插件残留及UI状态膨胀;应禁用index_files、清空Cache Local Index三类目录、删除Packages User下残留配置,并对大文件切Plain Text模式。 如果觉得Sublime Text只是“有点慢”,那可能还没找到症结。真正
Sublime怎么实现代码自动保存?Sublime失去焦点自动存盘的设置
Sublime Text唯一原生自动保存方式:失焦即存 很多开发者习惯了一边写代码,一边切到浏览器或终端查看效果。这时候,一个不留神,可能就忘了按 Ctrl+S。那么,Sublime Text 能像某些现代编辑器那样,实现“代码一改就存”的实时自动保存吗? 答案是:不能。Sublime Text 本
- 日榜
- 周榜
- 月榜
1
2
3
4
5
6
7
8
9
10
相关攻略
2015-03-10 11:25
2015-03-10 11:05
2021-08-04 13:30
2015-03-10 11:22
2015-03-10 12:39
2022-05-16 18:57
2025-05-23 13:43
2025-05-23 14:01
热门教程
- 游戏攻略
- 安卓教程
- 苹果教程
- 电脑教程
热门话题

