请教吧友们一个关于位置关系生成的问题【stablediffusion吧】

stablediffusion吧关注：34,468贴子：124,559

4回复贴，共1页

请教吧友们一个关于位置关系生成的问题

我想要训练一个logo生成向的模型，由于logo通常会包含主题元素部分和文字部分，sd生成文字的效果又很差，所以想到了分阶段生成再拼接，但遇到了一个问题不知道如何用扩散模型解决。我目前想要训练一个能根据描述文本生成两个物体位置关系的扩散模型，生成的结果是两个不同颜色的几何体色块用来表示logo主体区域和文字区域，生成的重点在于色块的几何形状和位置关系，但目前没有看到相关的应用和论文，也不知道数据集构建和训练时应该用哪些trick来更好地实现想要的效果，恳请吧内的大佬解答。