https://youtu.be/Dj9R1PpuT8M

实时检测视频中的特定对象,然后分割对象,使用自然语言来对特定的对象进行替换、修改、风格化等! 是不是很熟悉?科幻片里面的场景就实现了! 这意味着你可以对任意图像和视频里面的内容进行实时的替换和修改,甚至换掉视频中的某个人物。

作者@skalskip92

在线体验:http://huggingface.co/spaces/SkalskiP/YOLO-World

使用 YOLO-World + EfficientSAM 组合对源剪辑进行零样本分割。

prompt: "woman walking in red dress" 提示:“穿着红裙子走路的女人” 实时检测穿着红裙子走路的女人

可以更加精细化:只检测女人身上的红裙子

YOLO-World + EfficientSAM 的ComfyUI实现,感兴趣的可以尝试

GitHub:https://github.com/ZHO-ZHO-ZHO/ComfyUI-YoloWorld-EfficientSAM

视频:https://youtu.be/Dj9R1PpuT8M