Midjourney学习笔记——图生图相关命令

最开始接触AI绘图的时候是觉得很新奇，对这个不是很懂但觉得这应该是一个划时代的产物，先前两篇AI绘图的博客就是在这个背景下写的。后来一段时间内，因为对我来说没什么应用环境，所以觉得AI绘图相关更像是玩具，媒体的噱头。

直到最近，我业余开始做一些新媒体账号，有了做封面图的需要，于是又开始重新研究AI绘画相关内容。我发现之前自己还是太浮躁了，只是浅尝辄止用了一下，没有去探究深层次的用法，所以我准备开一个Midjourney的学习笔记专辑，一边学习一边复盘。

describe命令（基于图片生成prompt）

describe命令允许用户上传图像并获得四个试图描述图像的文本提示。describe 命令的输出是一组大致描述图像的文本提示。我认为这是很好地学习模仿他人prompt、获取灵感的方式，在实际应用中，我们可能社交平台中看到自己喜欢的美图（不限于AI生成图），我们就可以通过该命令反推prompt。

这是我在discord其他频道看到的一张很喜欢的图，当时保存下来之后忘记记录prompt了，这里我就用了describe命令试图复现该图的prompt。

但实际上describe命令也是有局限性的，我记得当时作者的prompt中提到了插画师dao trong le，但反推的4条prompt中并没有以上信息，另外我用语句1生成的4张图片和原图还是存在差异性的，这源于describe没法提供模型版本、–stylize（风格化参数）这类后置参数信息。

这条命令还有进阶用法，可以使用多张图片，生成多个反推的提示词，然后使用chatGPT将多个提示词合并融合，就可以使用新的提示词生成一张由多张图片融合后的图片，这种融合方式相比较于blend命令可以自由搭配提示词，会更灵活一些。

blend命令（混合图片）

输入blend命令后，系统会提示上传两张照片，要添加更多图像，直接输入image3、image4或image5即可，最多能混合5张图片。混合图像的默认纵横比为 1:1，但可以使用可选dimensions字段在方形纵横比 (1:1)、纵向纵横比 (2:3) 或横向纵横比 (3:2) 之间进行选择。

每张图片在混合模式中的权重是平均分配的，实际使用中我觉得还是两张图的混合比较合适，多张图生成图元素就比较混乱了，以下是我之前生成的古风美女和上文提到图片的混合：

从结果来看我还是很满意的，融合效果相当不错，我觉得可以拿去当头像了。blend指令不适用于文本提示，要同时使用文本和图像提示，需要imagine实现，也就是说blend指令功能是包含于imagine中的，且imagine命令支持5个以上图片的混合。实际使用中，当我不需要文本提示，只是混合图片的话，我会用blend命令，因为这可以省去获取图片链接的过程。