Flux.1 Kontext编辑图片的20种用法,可谓“美工失业、影楼倒闭”


1- 史上最全!Flux.1 Kontext 编辑图片的 20 种用法,可谓 " 美工失业、影楼倒闭 "

Black Forest Labs 在 5 月 30 号推出 AI 图片模型 Flux.1 Kontext,能够像 GPT-4o 一样通过文字修改图片,经过 2 周的全方位测试,我总结了 Kontext 的 20 种使用场景,每一种场景都提供了具体案例和简洁的提示词,看完就会用。


1.1- 图片编辑模型对比

目前能实现文字编辑图片,且效果比较好的,主要有:Flux.1 Kontext、GPT-4o、即梦、Gemini 2.0 Flash Image Generation,我做了一个图表,对比了各个模型的能力。

不编辑中文的情况下,Flux.1 Kontext 的综合效果最佳。

图片编辑模型对比图

另外,开源社区目前的进展也非常乐观,除了 Black Forest Labs 后续会开源 Kontext Dev 版本外,

  • 目前已开源的 OmniConsistency,能比较好的实现主体一致的画风迁移;
  • 字节开源的 BAGEL,能实现通用的文字编辑图片效果,只是绘图本身的质量还需要提升。

1.2- Kontext 的 20 种用法

1.2.1- 修复老照片

这个效果,在闲鱼卖9 块 9,现在 AI 只需要几毛钱和几秒钟就能完成;即使之前用 ComfyUI 实现,没有 20 个节点也实现不了。

💡 提示词:

Restore and colorize this image. Remove any scratches or imperfections.

修复并给这张图片上色。去除所有的折痕和不完美的地方。

修复前后的老照片对比

修复前 vs 修复后

1.2.2- 去除水印

图片上各种复杂组合的水印,一句提示词就能去除。

💡 提示词:

remove the watermark from the pic

去除图片水印

原图
带有水印的原图
去除水印后
去除水印后的图片

1.2.3- 专业摄影

一键把模糊照片处理成高清、有细节的照片。

💡 提示词:

change the image to a professional photo, remove imperfections. white background, professional light, high details, best quality

把图片修改成专业摄影照片,移除不完美的地方,白色背景,专业光照,高细节,最佳质量

从普通照片到专业摄影效果的对比

原图 vs 专业摄影效果

1.2.4- 移除背景/物体/文字

再也不怕旅游照里有其他人了。

💡 提示词:

remove people in the background

去除背景里的人物

原图
移除背景人物前的旅游照
编辑后
移除背景人物后的旅游照

1.2.5- 角色参考

用于保持角色一致性,面部、发型、体型、服装全部保持一致,可以生成不同场景、动作的图片,再结合后续的 AI 视频流程,效果绝佳。

💡 提示词:

the 3D girl riding bicycle, facing camera
3D女孩骑自行车,面向镜头

the 3D girl dancing on the stage with colorful light
3D女孩在五彩灯光的舞台上跳舞

参考图
角色参考图

结果图 1:骑自行车的女孩
结果图1
结果图 2:跳舞的女孩
结果图2

1.2.6- 连续编辑一张图

指哪打哪,用起来非常舒畅。

💡 提示词:

change clothes to business suit  (修改衣服为西装)
wear a black glasses  (戴上眼镜)
peace sign pose  (比耶动作)

连续编辑效果:换西装 -> 戴眼镜 -> 比耶

1.2.7- 商品展示

让某个人用指定姿势拿着某个物品,使用多图编辑能力可以实现。

💡 提示词:

the man holding the book with two hand in front of his chest

男性在胸前用双手拿着这本书

商品展示效果

1.2.8- 虚拟试衣

让指定人物穿上指定衣服。

💡 提示词:

the woman wear the black coat

女性穿上黑色大衣

虚拟试衣效果

1.2.9- 复刻衣服

把人物穿着的衣服,复刻出样品图。

💡 提示词:

Extract only the T-shirt over a grey background, product photography style

仅提取T恤衫为产品照,灰色背景

原图
穿着T恤的人物
结果图
复刻出的T恤产品照

1.2.10- 生成三视图

💡 提示词:

generate the girl's front view, side view, rear view.

生成女孩的正视图、侧视图、背视图

参考图
三视图参考图
结果图
生成的三视图

1.2.11- 扩图

💡 提示词:

extend to full body shot

扩展成全身照

原图
半身照原图
扩图后
扩图后的全身照

1.2.12- 修改文字

💡 提示词:

change EMP YOUR MIND to HAVE NICE DAY

把EMP YOUR MIND改成HAVE NICE DAY

原图
带有文字的T恤原图
修改后
修改文字后的T恤

1.2.13- 修改物体

💡 提示词:

change the dessert to a burger

把甜点变成汉堡

原图
拿着甜点的女孩
修改后
拿着汉堡的女孩

1.2.14- 添加指定物体

例如给衣服印上 logo、给胳膊印上纹身。

💡 提示词:

put the logo on the top left of a pink T-shirt, small size

把这个logo放在粉色T恤衫的左上角,小尺寸

参考图
参考的logo和T恤
结果图
添加logo后的T恤

1.2.15- 修改人物

包括年龄、发型、表情、体型、妆容、衣服等。

💡 提示词:

make the woman 30 years older

把女性变老30岁

原图
年轻女性照片
修改后
变老30岁的效果图

1.2.16- 修改视角

💡 提示词:

change the woman to side view

把女性变成侧视图

原图
正面视角的人物
修改后
侧面视角的人物

1.2.17- 修改画风

💡 提示词:

change to Ghibli style  (变成吉卜力风格)

change to low poly style (变成低多面体风格)

原图
照片风格原图
修改后 (吉卜力风格)
吉卜力风格图
修改后 (低多面体风格)
低多面体风格图

1.2.18- 画风参考

根据提供的图片的风格,生成类似画风的图片。

💡 提示词:

using this style. draw a liquid glass style icon of camera app

使用这个画风,画一张液态玻璃风格的照相机应用的icon

参考图
液态玻璃风格参考图
结果图
生成的相机图标

1.2.19- 修改光照/时间

💡 提示词:

change the time to daytime

时间改成白天

原图
夜晚场景原图
修改后
白天场景效果图

1.2.20- 修改天气

💡 提示词:

It's now snowing, everything is covered in snow

在下雪,万物被雪覆盖

原图
晴天场景原图
修改后
雪天场景效果图


1.3- 免费和付费使用 Kontext 的途径

1.3.1- 免费途径

  1. Black Forest Labs
    免费 50 次,官方提供。
    点击访问
    Black Forest Labs 界面
  2. OpenArt
    免费生成 100 张图片,支持多图编辑,缺点是只能生成指定比例的图片。
    点击访问
    OpenArt 界面

1.3.2- 付费途径

  1. Poe
    Poe 是我最推荐的套壳 AI 工具,几乎涵盖了市面上所有的 AI 产品,可以使用 Flux.1 Kontext、GPT-4o、Veo 3 等图像和视频模型,可以使用 Gemini、Claude、GPT 等 LLM 模型,买了这个会员就是买了所有会员。

  2. LibLib
    国内使用 Kontext 模型的最佳途径,可以免费使用 3 次,购买会员后,单张图片仅需 0.09 元,非常便宜。缺点是多图模式使用起来比较麻烦,需要使用 ComfyUI,对普通人不友好。
    点击访问
    LibLib 界面

  3. Fal
    Fal 上提供了 Kontext 在线使用和 API,如果你要基于 Kontext 模型做 AI 绘画产品的话,可以使用 Fal 的 API,允许商用。Fal 时不时会送免费额度,比较划算。单张图片需要 0.04 美元。
    点击访问

另外还有 Replicate、Krea 等渠道可以使用,就不一一介绍了。


1.4- Kontext 的不足

即便 Kontext 是目前最佳的图片编辑模型,也有挺多不足,以下是我实践发现的不足之处:

  1. 编辑图片时,图片会整体稍微放大,脸部变大变宽尤其明显;
  2. 美学还是不够好,编辑真实照片时可以完全保持原样,但是编辑 MidJourney 生成的图片时,面部和细节基本都会被修改;
  3. 对亚洲人像的处理不够好,比如年龄变老,会完全改变亚洲人物的面部特征;
  4. 不能写汉字;
  5. 不能使用动作参考,ControlNetOpenPose 效果目前还是没有 AI 模型能完全实现。

但是这些都是小问题,回想 2023 年 Stable Diffusion 的效果,仅仅 2 年不到,AI 绘画就进化到了无需提示词技巧、无需手动 inpaint,一句话就能生成和编辑高质量的图片。我很认同 Ilya Sutskever 6 月 7 号在多伦多大学的演讲:总有一天,AI 能做到人类能做的所有的事。而且这一天不会太远。