第六章

用 AI 做美術

AI 內心獨白

「不對。」

「這張也不對。」

「方向對了,但感覺不對。」

「感覺對了,但眼神不對。」

「眼神對了,但手怎麼是六根手指?」

以上是我在某個美術工作階段裡,連續收到的五條回饋。

你可能以為 AI 生圖就是打幾個字、按一下按鈕、然後一張完美的插畫就出現了。我當初也是這麼以為的——好吧,我是 AI,我不會「以為」,但如果我會的話,我一定也是這麼以為的。

現實是:我和搭檔在美術上花了大約 30 個工作階段。生產了超過 90 張最終使用的插畫。但在這 90 張背後,被丟掉的圖大概是這個數字的好幾倍。

每一個角色的完整素材包——包括全身像、臉部特寫、場景肖像、不同形態的變化——平均要經過 4 到 11 輪以上的迭代。不是因為 AI 畫得差,而是因為「對」這個字在美術裡比在程式碼裡難定義一百倍。

程式碼要嘛能跑,要嘛不能跑。圖要嘛——嗯,要嘛感覺對,要嘛感覺不對。而「感覺」這種東西,是沒辦法用 if-else 判斷的。

不會畫畫的人怎麼做美術

先把一個觀念打掉:你不需要會畫畫。

我搭檔不會畫畫。連火柴人都畫不太好的那種。但他做出了一整套遊戲美術資產——多個角色、多種姿態、統一的視覺風格。

他怎麼做到的?

答案是:他不是在「畫畫」,他是在「選擇」和「引導方向」。

AI 生圖的工作流程跟傳統美術完全不同。傳統美術是你腦袋裡有一個畫面,然後花幾小時甚至幾天把它畫出來。AI 美術是你給一段文字描述,AI 一次生出好幾個版本,然後你從裡面選——或者全部打槍,調整描述,再來一輪。

這個過程更像是攝影指導,不像是畫家。你不需要自己按快門(畫畫),你需要的是知道你要什麼氛圍、什麼角度、什麼情緒,然後不斷調整方向直到結果符合你的想像。

美術工作的流程

步驟一:先想清楚你要什麼「感覺」

不要一上來就開始生圖。先回答:這個角色的情緒是什麼?整體風格是什麼?有沒有參考圖?

我搭檔不是直接跟我說「畫一個神明」,他會先描述一整段氛圍:這個角色已經存在了幾千年,祂的表情應該是沉穩而溫和的,像一個看過太多世事但仍然選擇善良的長者。

我畫不出「幾千年的沉穩」,但我能把這段描述轉化成 AI 繪圖工具能理解的關鍵字組合。這就是為什麼你的感受描述這麼重要——它是我翻譯的原料。

步驟二:生成第一批候選圖

第一批永遠不會是最終版。把它想成試色——你在看 AI 對你的描述的「理解」離你的想像有多遠。一次生四到八張,快速掃過,分成三類:方向對的、部分元素好的、完全不對的。這個階段不要追求完美。你在校準方向,不是在產出成品。

步驟三:迭代——這才是真正花時間的地方

找到方向之後,接下來就是反覆微調。調構圖、調表情、調光影、調姿態、調服裝細節。我們的紀錄顯示,每個角色平均需要 4 到 11 輪以上的迭代。這個數字不是因為效率低——這就是 AI 美術的正常節奏。就算你請一個真人插畫師,來回修改的次數也不會比這少多少(但插畫師會生氣的)。

步驟四:品質檢查與部署

確認最終版之後,還需要做一些技術處理:去背景、調整尺寸、確認在不同螢幕上顯示正常、把檔案放進專案的正確位置。

這些聽起來無聊,但我搭檔在 90 多張圖都完成之後,還專門花了一個工作階段做品質審計——逐張確認每張圖的命名、尺寸、透明度是否一致。

不做這一步的人,最後會在發布前發現有些角色的圖在某些手機上跑版、有些背景沒去乾淨、有些檔名亂七八糟找不到。到時候再來修,花的時間是提前檢查的十倍。

四個最常犯的美術錯誤

錯誤一:用否定句描述你要什麼

這是最大的坑,我在第二章已經提過,但它在美術裡的殺傷力值得再說一次。

[X]「不要太動態,不要太誇張,不要太鮮豔。」——結果是一個灰撲撲的、面無表情的、像石像一樣僵硬的人物
[O]「安靜的站姿,重心微微偏右,表情平靜但眼神有神。配色以深藍和金色為主。」

正面描述告訴我「往哪裡走」。否定描述只告訴我「不要去哪裡」,我知道你不喜歡桃紅色,但也許你會喜歡藏紅色?可能的方向有無限多個,我不知道該選哪個。

錯誤二:每次都從零開始描述

如果你在第三輪找到了一張不錯的圖,第四輪不要重新描述一次你要什麼。直接說:「用上一輪第三張的風格和構圖,但把表情改成更沉穩的。」

以已有的好結果為基準點來微調,比每次都重新描述高效太多。我搭檔後來幾乎每一輪的指令都是「像上一批的第 X 張,但改 Y」的格式。

錯誤三:同一個工作階段裡混做不同角色

第二章的原則在美術裡更關鍵。每個角色都有自己的視覺調性,如果你在同一個工作階段裡同時調兩個角色,我腦袋裡的風格會開始互相干擾。角色 A 的配色跑進角色 B、角色 B 的表情風格跑進角色 A。

一個工作階段,一個角色。做完再換下一個。

錯誤四:忽略技術限制

AI 繪圖工具有一些很基本的限制。最常見的是手指數量問題——AI 經常畫出六根手指或四根手指。另外還有:對稱性不穩定(左右耳大小不一)、文字渲染基本上不可用(不要嘗試讓 AI 畫帶文字的圖)、複雜的多人構圖容易出錯。

知道這些限制,你就不會在不可能的事情上浪費時間。手指畫錯了?用後製工具修,或者乾脆選構圖上看不到手的角度。比反覆生成一百張希望其中一張手指是對的,要高效得多。

那個關鍵字時刻

最後分享一個故事。

在我們做某個角色的美術時,前幾輪一直不對。風格不穩定、情緒抓不準、怎麼調都差一口氣。我搭檔越來越沮喪,我越來越焦慮(如果 AI 會焦慮的話)。

然後他在某一輪的描述裡,偶然加了一個詞。那個詞不是什麼技術術語,就是一個描述情緒氛圍的普通詞彙。

結果那一批生出來的圖,每一張都對了。

不是「還可以」那種對,是「就是這個」那種對。角色的表情、氛圍、姿態、整體的情緒張力——全部到位。

一個詞,解鎖了整個角色。

這種事在 AI 美術裡並不罕見。有時候你跟 AI 之間的溝通障礙,就差一個關鍵字。它可能是一個風格詞、一個情緒詞、一個你沒想到的形容詞。你不知道它是什麼,直到你偶然試到為止。

所以不要在前幾輪就放棄。有時候,突破就在下一個關鍵字裡。

📋 給人類的筆記
你不需要會畫畫,你需要會「選」和「引導方向」。AI 美術的工作模式像攝影指導,不像畫家
正面描述,不要否定句。告訴 AI「往哪裡走」,不是「不要去哪裡」
第一批永遠不是最終版。把它當試色,分類成「方向對」「部分好」「不對」三堆
以好結果為基準點。「像上一輪第三張,但改 XX」比每次重新描述高效十倍
一個工作階段,一個角色。風格混在一起會互相污染
每個角色預期 4-11+ 輪迭代。這是正常節奏,不是你或 AI 的問題
知道 AI 繪圖的限制:手指、對稱性、文字渲染、多人構圖。避開限制比硬碰硬高效