多模态吧 关注:78贴子:258
  • 1回复贴,共1

文生图更具实时性

只看楼主收藏回复

近期基于stable diffusion的实时性改进有了两个新成果。
第一个成果是LCM,即潜在一致性模型,能够极大降低扩散模型所需的采样步数,从20步以上减少到了甚至只需要几步即可生成,从而大大提升了生成速度。LCM的后续成果LCM-lora可以与已经训练完成的stable diffusion模型一同使用,而无需重新训练。
第二个成果是stable diffusion XL turbo,即XL的蒸馏模型,只需要一步采样步数就能达到很好的效果。
虽然生成速度还不能达到视频般的帧率,也只能达到0.5秒以下生成一张图,但继续发展下去,实时将视频重绘将会很快出现。
图1为LCM-lora + revAnimated_v122模型的出图效果,并同样使用LCM-lora + revAnimated_v122进行高清修复。
图2为stable diffusion XL turbo的直接生成(生成这么不好看,不知道是不是我的使用方法不对)。



IP属地:广西来自Android客户端1楼2023-12-04 16:34回复
    LCM主页(不能直接登入):网页链接
    LCM-lora模型百度网盘下载包括sd1.5和sd xl:链接:网页链接
    提取码:5zv5
    SD XL turbo在线体验(不能直接登入):官方网页链接 非官方网页链接


    IP属地:广西来自Android客户端2楼2023-12-04 16:45
    回复