ComfyUI Flux模型安装部署与使用教程
Flux模型由StableDiffusion核心团队创立,参数量达120亿,视觉质量与提示词遵循能力突出。包含Pro、Dev、Schnell三个版本。部署需更新ComfyUI至最新版,下载VAE、UNet及CLIP文件。其优势在于细节真实、手部结构准确、支持文字生成,无需额外模型即可输出多样风格。
Midjourney 与 Stable Diffusion 无疑是当前 AI 图像生成领域的两大明星产品,它们均基于深度学习技术,能从文本描述生成高质量图像。然而,近期一位新玩家强势入局,势头甚至盖过前两者——它就是 FLUX。FLUX 生成的图像更加逼真,尤其在细节还原上,对现实世界的贴合度达到了全新高度。
实际上,Flux 备受瞩目的真正原因在于其出身。Black Forest Labs——这家公司由从 Stable Diffusion 离职的核心班底创立。可以说,他们带着对扩散模型最深刻的理解,从头打造了一套全新的 AI 绘图大模型。Flux 系列最大的亮点在于卓越的视觉质量、极其精准的提示词遵循能力,以及多样化的风格和复杂场景生成能力。目前,它主要包含三个针对性极强的版本:FLUX.1 [pro]、FLUX.1 [dev] 和 FLUX.1 [schnell]。
三个版本,各司其职
FLUX.1 Pro 是专为商业用途设计的闭源模型,性能极致,适合商业级输出场景。
FLUX.1 Dev 则是开源引导蒸馏模型,主要面向非商业应用,为社区开发者提供强大基础。
而 FLUX.1 Schnell,顾名思义,专为本地开发和个人使用设计的快速版,追求速度至上。
从技术层面看,Flux 采用了创新的混合架构,融合多模态处理能力和并行扩散机制的 Transformer 技术,参数量高达 120 亿。它在训练方法上采用流匹配技术,相比传统扩散过程,这种方法不仅通用性更强,概念也更加简洁、直接。

硬核对决:Flux vs Midjourney vs Stable Diffusion
单纯说它好可能不够直观,我们直接把它和两位当红选手放在一起,看看在几个核心维度上的差异:
图像质量
Flux:无需额外插件辅助,原生就能生成高分辨率、细节丰富的图像,尤其在处理复杂场景和人体解剖学(比如手部)上,表现惊人。
Midjourney:以独特艺术风格和高质量输出见长,在艺术性和风格多样性上拥有天然优势。
Stable Diffusion:其优势在于真实感输出,适合对照片级画质有严格要求的项目。
速度与效率
Flux:特别是 schnell 版本,生成速度极快,非常贴合快速原型制作和迭代设计的场景。而且,大多数情况下无需额外下载各种风格模型,就能出各种风格的作品。
Midjourney:作为云端商业工具,速度受服务器负载和队列影响,有时需要耐心等候。
Stable Diffusion:原生速度较慢,但用户对生成过程拥有极高的控制权和优化空间。
处理复杂场景
Flux:得益于先进架构,在处理复杂构图时游刃有余。最亮眼的一点是,只要提示词足够精确,Flux 可以直接输出带有准确文字的图片,甚至直接生成初步的、带有文字信息的设计海报。
Midjourney:也能处理复杂场景,但往往需要反复迭代和调整,才能接近理想效果。
Stable Diffusion:在处理过于复杂的场景时,有时会显得力不从心。
人体解剖渲染
Flux:对手部细节的还原堪称一绝,手指数量、结构错误这类“老大难”问题,在 Flux 上得到了根本性改善。
Midjourney:更擅长生成具有艺术感的人物图像,但难以精准实现对细节的指定描绘。
Stable Diffusion:在准确描绘人体特征(尤其是手部)时,通常需要依赖额外插件或后期处理才能勉强修正。
灵活性与集成
Flux:提供了从开源到商业的多种变体,适用场景跨度极大。
Midjourney:作为商业产品,定制化空间相对有限。
Stable Diffusion:开源社区驱动,提供了最丰富的定制化和集成选项。
开源与商业
Flux:提供开源模型,积极鼓励社区参与和创新。
Midjourney:典型的商业模型。
Stable Diffusion:老牌开源模型,社区生态极其活跃。
小结一下 Flux 的核心优势:
(1)画面更细致,视觉效果跨越了一个台阶。
(2)对图片内文字的生成支持更完整、准确。
(3)人物手部等细节基本符合现实,很少出错。
(4)模型本身内置了丰富的风格库,不依赖额外模型即可输出多样风格。
(5)可以忽略负面提示词,仅靠正面提示词就能精准输出。
说到底,Flux 之所以表现如此抢眼,核心原因其实很简单:参数量的碾压。Stable Diffusion 3 最高版本的训练参数为 8B(约 80 亿),而 Flux 1 一上来就是 12B(120 亿),整整多出近一半。单个模型大小就达到 23GB,庞大的参数量是性能的硬道理。
Flux 模型的三大版本




*注意:如果计划使用 GGUF 和 NF4 格式的模型,需要额外安装对应的节点插件。


手把手:如何部署安装 Flux?
第一步:确保你的 ComfyUI 是最新版本。这一步非常关键,因为 Flux 是 8 月前发布的,必须保证你的 ComfyUI 更新到 8 月 1 日之后的最新版本,否则后续会踩不少坑。

第二步:前往 Hugging Face 官网下载模型文件。
你需要下载两个核心文件:ae.safetensors(即 VAE)和 flux1-dev.safetensors(即 UNet)。


第三步:下载 CLIP 文件。
进入 ComfyUI 的官方 GitHub 主页,找到 Flux 的示例页面,下载以下三个文件:clip_l.safetensors、t5xxl_fp16.safetensors、t5xxl_fp8_e4m3fn.safetensors。



第四步:将下载好的文件放入 ComfyUI 对应的文件夹中。

第五步:如果需要使用 ControlNet 或 LoRA 等高级功能,可以前往 XLabs-AI 的 Hugging Face 主页下载对应资源。
注意:如果要使用 Flux 模型的 ControlNet 或 LoRA 功能,还需要在 ComfyUI 的节点管理器里搜索并安装 XLabs-Ai 插件,安装完成后重启 ComfyUI。



第六步:调整系统虚拟内存。由于 Flux 模型运行时占用的内存非常大,强烈建议打开系统的虚拟内存,并勾选“自动管理所有驱动器的分页文件大小”。

拿过来就能用:快速上手
官方非常贴心地提供了现成的 ComfyUI 工作流,你只需要把官方 GitHub 示例里的图片直接拖拽到 ComfyUI 窗口中,对应的节点就会自动加载。这是最快的入门方法。

以 flux_dev_example 工作流为例,拖拽图片后得到如下节点结构:

如果拖入的是 flux_schnell_example,则得到另一个更精简的节点结构:

我们可以清晰地划分其结构:

flux_schnell_example 是最简单的版本,仅需四个步骤即可出图。
不妨先从最简单的开始,在 flux_schnell_example 工作流里输入下面这个提示词试试:
“一个穿着校服的女孩,拿着粉笔在黑板上写着开心文字,真实摄影,学校教室,半身构图,电影灯光,细节丰富,日式低饱和度”
英文提示词:A girl wearing a school uniform, holding chalk to write happy words on the blackboard, real photography, school classroom, half body composition, movie lighting, rich details, Japanese low saturation
出图效果非常惊艳:

(1)黑板上的文字准确无误;
(2)人物的手部结构完全正常;
(3)质感效果完美符合真实摄影的风格;
(4)出图速度快,几乎没有等待感。
接着,我们在模型之间插入一个 LoRA 加载器,并从网上下载了一个“黑神话悟空”的 LoRA 模型加载进去。

模型使用 fp8 schnell 版本,使用 LoRA 作者提供的描述词,然后启动队列。在测试的电脑上(32G 内存,英伟达 2080 显卡),内存占用可以达到 85% 到 98%。
输入以下提示词:
“悟空,在绘画室内,绘画,素描,画笔,写字,努力工作,(大文字‘不想工作’)”
英文提示词:Wukong, in the painting studio, painting, sketching, using a paintbrush, writing, and working hard (big text says 'don't want to work')
得到的图像如下:

简单的描述,甚至不用写负面提示词,添加 LoRA 后,人物手部、文字等细节都处理得很好。
总的来说,Flux 模型确实对电脑配置有较高要求,但即使是较小的量化模型,效果也差不了太多。对于普通自媒体应用、方案创意等场景来说,完全够用了。当然,如果你熟悉 ComfyUI,还可以通过添加放大节点、ControlNet 等高级功能,进一步挖掘它的潜力,产生更多惊人的效果。
你是一名 AI 行业编辑,请围绕下面这条热点输出一份资讯解读:
热点:ComfyUI Flux模型安装部署与使用教程要求:
1. 先用一句话解释这条热点在讲什么
2. 再总结它为什么重要
3. 说明会影响哪些 AI 产品或内容方向
4. 最后给出 3 个适合资讯站使用的标题
游乐网为非赢利性网站,所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系youleyoucom@outlook.com。
相关热点GoogleMeet是面向商业与企业的视频会议服务,支持屏幕共享、实时字幕及与GoogleWorkspace集成,适用于项目讨论、网络研讨和线上教学等多种会议场景,具备扎实的安全与隐私保护。
Lanter是Chrome扩展,利用AI将YouTube视频语音转为带时间戳的文字笔记,支持一键抓取高光、自动标点排版、书签管理、全局搜索及每日邮件汇总,方便高效回顾视频关键内容。
一款AI驱动的Chrome扩展音频笔记应用,支持录音自动转文字、标签分类与全文搜索,将语音转化为可检索的数字资产,显著提升信息定位与管理效率。
专为GoogleMeet设计的AIChrome扩展,实时转录会议内容,自动生成摘要并提取行动项与决策,无缝同步至Google文档、任务及Gmail,省去手动整理时间,显著提升协作效率。
- 日榜
- 周榜
- 月榜
热点快看
