最近开始模仿那些大神已有的语句生成图片,我对比了一下我和那些优秀prompt的区别,发现我写提示词的时候没什么章法,总是想到什么写什么,东一榔头西一棒子。我觉得写prompt要遵循一定的语法结构会比较好,于是我就去搜索了相关教程学习了一下,以下是我整合了一部分教程形成的Prompt提示词学习笔记。
提示词的定义
提示词是AI绘图的核心和主体,是与AI对话的语言,只有准确的提示词才能生成特定风格、满足既定需求的图片,也就是说提示词Prompt是AI绘画的魔法和咒语。
官方文档
A Prompt is a short text phrase that the Midjourney Bot interprets to produce an image. The Midjourney Bot breaks down the words and phrases in a prompt into smaller pieces, called tokens, that can be compared to its training data and then used to generate an image. A well-crafted prompt can help make unique and exciting images.
提示词Prompt是这样一个简短的文本表述语句,Midjourney机器人将其转译来生成一个图像。Midjourney机器人将提示词中的单词和短语分解成更小的片段,称之为令牌,而这些令牌可以与Midjourney训练数据进行比较,然后用来生成图像。一个精心设计的提示词可以帮助你生成独特的和令人兴奋的图像。
模型训练时AI会将自然语言提示词拆解为一个个token令牌,将文本转化为数字,将文本这种高维信息降维为数学可以处理的向量数据,从而将视觉信息转化数学运算,经过复杂的算法增加噪点以及逆向去噪最终释放维度还原为图片信息。
提示词描述架构
Midjourney主要是提取关键字生成图像的,所以单词的选择至关重要。其实最主要的就是想清楚你自己想要的图片中包含什么。我们可以总结一个比较通用的句式结构,通过换提示词,得到自己想要的图片,公式如下:
主体描述+环境场景+艺术风格+媒介材料+摄像机视角+精度定义
我这里写了一个示例:
a beautiful chinese girl, ancient hair bun, long hair, white dress, white skin(主题描述),surrounded by bamboo grove,green, soft light,dynamic expressive force, soft color, sunny, light and shadow(环境场景), fairy style(艺术风格),gentle abstract painting(媒介材料), close shot(摄像机视角),8k –ar 3:4(作品精度定义)
其实倒也不必每次写提示词的时候把所有维度都描述出来,这里我只是套用了一下模板,我认为这个通用架构的作用是在我们构思图片大脑空空的时候提供一些思考的角度。
提示词的写作方法
在具体文本提示词写作上,目前经过Midjourney绘画爱好者各自探索,已经形成了多种提示词写作方式,尤其是对于长提示词或者超长提示词。有如下提示词写作方式:
常规提示词写法(normal prompting)
这是我们写作提示词的最常用的方式,短语词组之间使用逗号分隔。
a cat in polygonal art colorful animal sitting in dark background, in the style of escher-inspired, low resolution, color gradients, highly realistic, digital print, neon realism, mosaic-inspired realism –ar 3:4 –v5.1
分类提示词法(Category prompting)
这种写法方法使用逗号、竖线或分号分隔不同类别的元素,且在元素组前面额外添加一个类别名称,这样写作的好处是结构清晰,非常适合使用 ChatGPT 实现自动化。
IMAGE: Cinematic | GENRE: Adventure | MOOD: Mysterious |SCENE: A group of explorers venture into a dense forest,discovering hidden secrets and ancient relics | ACTORS: Explorers |LOCATION TYPE: Forest | TAGS: Adventure, mystery, forest, movie scene–ar 16:9 –v 5
Style: Magazine photography, Subject: Body builder Elon Musk, Features: he is extremely muscular with massive vascularity and striated muscles, covered in colorful tattoos –ar 2:3
VISUAL_FORMAT: Cinematic::1 | GENRE: Adventure::1 | MOOD: Mysterious::1 | SCENE: A group of explorers venture into a dense forest, discovering hidden secrets and ancient relics::1 | ACTORS: Explorers::1 | LOCATION TYPE: Forest::10 | TAGS: Adventure, mystery, forest, movie scene::1 –ar 16:9
叙事式提示词法(Narrative prompting)
当 Midjourney 开发人员宣布最新模型可以更好地理解自然语言时,这种写作方法一度在 V5 中变得流行。具体就是指在写作时用我们日常的自然语言以散文风格或者写小作文的形式来写提示词。这种方式在表达情绪或描述场景时可能有用,但没法控制或确定哪个词组词汇对提示词更有用。
In a cinematic adventure scene, a group of explorers tread cautiously through a dense forest. With a mysterious atmosphere surrounding them,they uncover hidden secrets and ancient relics that lay hidden within the forest’s depths. –ar 16:9 –v 5
疑问句提示词写作法(Interrogative prompting)
据Nick St. Pierre介绍,这种写作法源自V3版本时期,由Eroteme Art提出。这种方法难以控制,但也可能有意想不到的艺术效果。
What would a mysterious adventure scene look like, where a group of explorers venture into a dense forest and discover hidden secrets and ancient relics? –ar 16:9 –v 5
提示词大全
这部分网上的帖子写的太散碎了,我直接花钱买了一份15000+关键词整理版,解决了写关键词脑子空空的问题。
总结
本篇学习笔记结合了网上几个教程中关于提示词写法的部分,相当于是汇总帖了,后面再补充一篇后缀参数的博文,基本就算入门Midjourney了。
参考资料
1、Midjourney关键词大全+万能公式
2、【Midjourney教程】提示词(Prompts)
3、Midjourney简明教程(四):Prompt提示词入门
评论 (0)