Python3.12怎么快速遍历深层目录下的所有文件_使用os.walk与glob递归检索
Python3.12怎么快速遍历深层目录下的所有文件_使用os.walk与glob递归检索
免费影视、动漫、音乐、游戏、小说资源长期稳定更新! 👉 点此立即查看 👈
在文件系统操作中,os.walk 通常比 glob(“**/”) 更稳健。原因在于,os.walk 是原生为目录遍历设计的,天生支持错误捕获,能自动跳过不可读的目录。反观 glob,要实现递归必须显式设置 recursive=True,一旦遇到权限拒绝或路径过长等问题,往往会直接抛出异常导致整个遍历过程中断。
os.walk 为什么比 glob(“**/*”) 更稳?
这里有个关键点:在 Python 3.12 里,glob.glob 默认并不支持递归通配符 **,必须手动传入 recursive=True 才行。即便开启了递归,它在面对权限问题、符号链接循环或者超长路径时,也容易直接抛出 FileNotFoundError 或 OSError,让整个任务戛然而止。相比之下,os.walk 的“体质”就强韧得多——它本就是为遍历目录而生的,不仅能捕获错误,路径控制也更灵活,无需额外参数就能自然地跳过那些无法访问的文件夹。
几个实操建议,能让你用得更顺手:
- 使用
os.walk时,保持topdown=True(这是默认值)。这让你能在进入子目录前,就提前过滤掉不想处理的路径,比如轻松跳过.git目录。 - 如果只需要遍历文件(不包括目录本身),记得处理每一层返回的
files列表,可别误用了dirs列表。 - 遇到
PermissionError怎么办?可以用try/except块把os.walk的调用包起来,或者更优雅地,使用os.walk(..., onerror=handler)来指定错误处理函数。
glob(“**/*”, recursive=True) 的三个关键限制
在 Python 3.12 下使用 glob.glob 进行递归,recursive=True 这个参数是必须的,否则 ** 会被当作普通字符处理——这大概是新手最容易踩的坑。除此之外,它还有两个不那么明显的限制:
- 路径类型受限:它接受的路径必须是字符串,不能直接是
pathlib.Path对象,否则会报TypeError。 - 不区分对象类型:
**/*这个模式会同时匹配文件和目录。如果你只想获取文件,就得额外用os.path.isfile()或pathlib.Path.is_file()做一遍过滤。 - 错误处理脆弱:其底层依赖
os.listdir,但不会像os.walk那样自动跳过无法访问的子目录。一旦某个子目录打不开,整个glob调用就会宣告失败。
来看个例子:正确的写法是 glob.glob(“src/**/*”, recursive=True)。而 glob.glob(“src/**/*”)(缺少参数)或 glob.glob(Path(“src”) / “**” / “*”)(类型错误)都是行不通的。
立即学习“Python免费学习笔记(深入)”;
怎么安全地拿到所有文件路径(含绝对路径、相对路径、大小)?
实际开发中,需求往往不只是列出路径那么简单,我们通常还需要快速获取文件的元信息,比如大小。这时,os.walk 配合 os.path.join 和 os.stat 的组合,堪称最轻量高效的方案:
import os
for root, dirs, files in os.walk(“project”):
for f in files:
path = os.path.join(root, f)
try:
st = os.stat(path)
print(f”{path} {st.st_size}”)
except (OSError, FileNotFoundError):
continue # 跳过无法 stat 的文件(如被删除、权限不足)
有个细节值得注意:os.stat 通常比 pathlib.Path(path).stat() 略快一些,而且不会触发任何隐式的路径解析。如果你已经在使用 pathlibp.resolve() 之前,先判断路径是否存在,否则 resolve() 方法本身也可能抛出异常。
Windows 下路径分隔符和编码问题怎么避坑?
Python 3.12 在 Windows 上依然默认使用反斜杠 \ 作为路径分隔符,不过好消息是,glob 和 os.walk 都接受正斜杠 / 作为输入,它们会在内部自动完成转换。真正需要警惕的坑在这里:
- 当使用
glob匹配包含中文或特殊符号的路径时,务必确保源字符串是 UTF-8 编码。一个简单的做法是在脚本开头加上# -*- coding: utf-8 -*-,否则 Windows 控制台可能会解码失败。 os.walk返回的root、dirs、files都是str类型,而非bytes。但如果路径本身包含非法字节(这种情况比较罕见),os.walk会直接跳过该层级且不报错——这给调试带来了困难。因此,在处理复杂路径时,优先考虑使用pathlib.Path来替代原始的字符串操作。- 避免在拼接路径时混用
\和/。统一使用os.path.join()或者pathlib.Path / “sub”的写法,能让代码更清晰、更安全。
最后,关于目录深度:理论上嵌套层数没有上限,但 Windows 对单个路径的长度限制在 260 个字符(除非启用了长路径支持)。这时,os.walk 和 glob 的表现会截然不同——os.walk 会默默跳过超长路径,而 glob 则会直接报错。这个差异在进行自动化批量处理时,显得尤为关键。
游乐网为非赢利性网站,所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系youleyoucom@outlook.com。
同类文章
怎么利用 System.err 输出错误流并在控制台中以醒目的颜色标记(取决于终端)
怎么利用 System err 输出错误流并在控制台中以醒目的颜色标记(取决于终端) System err 默认行为不带颜色,终端是否显示颜色取决于自身支持 首先得明确一点:System err 本质上只是 Ja va 标准库里的一个 PrintStream 对象。它本身并不负责“颜色”这种花哨的玩
如何在 Java 中使用 ThreadLocal.remove() 确保在线程池复用场景下不会发生数据污染
如何在 Ja va 中使用 ThreadLocal remove() 确保在线程池复用场景下不会发生数据污染 说到线程池和 ThreadLocal 的搭配使用,一个看似不起眼、实则极易“踩坑”的细节就是数据清理。想象一下,你精心设计的线程池正在高效运转,却因为某个任务留下的“数据尾巴”,导致后续任务
怎么利用 Arrays.asList() 转换出的“受限列表”理解其对 add() 等修改操作的限制
Arrays asList():一个“受限”但实用的列表视图 在Ja va开发中,Arrays asList()是一个高频使用的方法,但你是否真正了解它返回的是什么?一个常见的误解是,它直接生成了一个标准的ArrayList。事实并非如此。 简单来说,Arrays asList()返回的并非我们熟悉
如何在 Java 中利用 try-catch 实现对“软错误”的平滑感知与非侵入式监控日志记录
如何在 Ja va 中利用 try-catch 实现对“软错误”的平滑感知与非侵入式监控日志记录 在 Ja va 开发中,我们常常会遇到一些“软错误”——它们不会让程序直接崩溃,却可能悄悄影响业务的正确性或用户体验。比如,调用第三方 API 时返回了空响应、缓存查询未命中、配置文件里某个非关键项缺失
Django怎么防止Celery任务重复执行_Python结合Redis实现分布式锁
Django怎么防止Celery任务重复执行:Python结合Redis实现分布式锁 你遇到过吗?明明只发了一次任务,后台却执行了两次。这不是代码写错了,而是分布式环境下一个经典的老朋友:多个worker同时抢到了同一个活儿。 为什么Celery任务会重复执行 问题的根源在于竞争。想象一下,多个Ce
- 日榜
- 周榜
- 月榜
1
2
3
4
5
6
7
8
9
10
1
2
3
4
5
6
7
8
9
10
相关攻略
2015-03-10 11:25
2015-03-10 11:05
2021-08-04 13:30
2015-03-10 11:22
2015-03-10 12:39
2022-05-16 18:57
2025-05-23 13:43
2025-05-23 14:01
热门教程
- 游戏攻略
- 安卓教程
- 苹果教程
- 电脑教程
热门话题

