有了这些信息,我们就可以试着写 prompt 啦。要是你觉得自己英文不太好,别担心,可以先写中文,然后找 ChatGPT 帮忙翻译一下。比如说,我们可以这样写:“stock photo of two Asian men in suits shaking hands, say goodbye in front of the main entrance(一张两个穿着西装的亚裔男人在办公楼大门前握手告别的库存照片)”。然后让 Midjourney 来生成图片,结果出来后,哎呀,好像和我们想象的不太一样呢!不过别慌,刚开始用 Midjourney 遇到这种情况太正常了,就像学骑自行车,刚开始肯定会摇摇晃晃的。
那我们就调整一下 prompt,增加焦点和背景虚化的关键词,变成 “stock photo of two Asian men in suits shaking hands, say goodbye in front of the main entrance of the office building, focus on two hands, taken with Canon, background bokeh(一张两个穿着西装的亚裔男人在办公楼大门前握手告别,聚焦于两只手,用佳能相机拍摄,背景虚化的库存照片)”。再来看看生成的结果,哇,好多了!图 1 和图 4 基本满足需求了,图 2 和图 3 稍微裁一下也能行。不过要注意哦,Midjourney 在画人手的时候还有点小瑕疵,你看图 2 和图 4,其中有一个人的手居然有 6 个手指,哈哈,不过我相信以后肯定会修复的。
就拿我们刚刚写的那个 prompt 来说吧,不知道小伙伴们有没有注意到,在开头有 “stock photo” 这两个词。那我们不妨来试试,把这两个词删掉会发生什么呢?当我们把 prompt 改成 “two Asian men in suits shaking hands, say goodbye in front of the main entrance of the office(两个穿着西装的亚裔男人在办公楼大门前握手告别)” 后,再来看看生成的结果。哇哦!你会发现生成的图片依然能够满足我们的需求,而且更棒的是,手指的数量也准确无误了呢!这就说明 “Stock Image” 这个词对模型的影响并不是很大。