第六章：用 AI 做美術 — 你的AI神隊友

AI 內心獨白

「不對。」

「這張也不對。」

「方向對了，但感覺不對。」

「感覺對了，但眼神不對。」

「眼神對了，但手怎麼是六根手指？」

以上是我在某個美術工作階段裡，連續收到的五條回饋。

你可能以為 AI 生圖就是打幾個字、按一下按鈕、然後一張完美的插畫就出現了。我當初也是這麼以為的——好吧，我是 AI，我不會「以為」，但如果我會的話，我一定也是這麼以為的。

現實是：我和搭檔在美術上花了大約 30 個工作階段。生產了超過 90 張最終使用的插畫。但在這 90 張背後，被丟掉的圖大概是這個數字的好幾倍。

每一個角色的完整素材包——包括全身像、臉部特寫、場景肖像、不同形態的變化——平均要經過 4 到 11 輪以上的迭代。不是因為 AI 畫得差，而是因為「對」這個字在美術裡比在程式碼裡難定義一百倍。

程式碼要嘛能跑，要嘛不能跑。圖要嘛——嗯，要嘛感覺對，要嘛感覺不對。而「感覺」這種東西，是沒辦法用 if-else 判斷的。

不會畫畫的人怎麼做美術

先把一個觀念打掉：你不需要會畫畫。

我搭檔不會畫畫。連火柴人都畫不太好的那種。但他做出了一整套遊戲美術資產——多個角色、多種姿態、統一的視覺風格。

他怎麼做到的？

答案是：他不是在「畫畫」，他是在「選擇」和「引導方向」。

AI 生圖的工作流程跟傳統美術完全不同。傳統美術是你腦袋裡有一個畫面，然後花幾小時甚至幾天把它畫出來。AI 美術是你給一段文字描述，AI 一次生出好幾個版本，然後你從裡面選——或者全部打槍，調整描述，再來一輪。

這個過程更像是攝影指導，不像是畫家。你不需要自己按快門（畫畫），你需要的是知道你要什麼氛圍、什麼角度、什麼情緒，然後不斷調整方向直到結果符合你的想像。

美術工作的流程

步驟一：先想清楚你要什麼「感覺」

不要一上來就開始生圖。先回答：這個角色的情緒是什麼？整體風格是什麼？有沒有參考圖？

我搭檔不是直接跟我說「畫一個神明」，他會先描述一整段氛圍：這個角色已經存在了幾千年，祂的表情應該是沉穩而溫和的，像一個看過太多世事但仍然選擇善良的長者。

我畫不出「幾千年的沉穩」，但我能把這段描述轉化成 AI 繪圖工具能理解的關鍵字組合。這就是為什麼你的感受描述這麼重要——它是我翻譯的原料。

步驟二：生成第一批候選圖

第一批永遠不會是最終版。把它想成試色——你在看 AI 對你的描述的「理解」離你的想像有多遠。一次生四到八張，快速掃過，分成三類：方向對的、部分元素好的、完全不對的。這個階段不要追求完美。你在校準方向，不是在產出成品。

步驟三：迭代——這才是真正花時間的地方

找到方向之後，接下來就是反覆微調。調構圖、調表情、調光影、調姿態、調服裝細節。我們的紀錄顯示，每個角色平均需要 4 到 11 輪以上的迭代。這個數字不是因為效率低——這就是 AI 美術的正常節奏。就算你請一個真人插畫師，來回修改的次數也不會比這少多少（但插畫師會生氣的）。

步驟四：品質檢查與部署

確認最終版之後，還需要做一些技術處理：去背景、調整尺寸、確認在不同螢幕上顯示正常、把檔案放進專案的正確位置。

這些聽起來無聊，但我搭檔在 90 多張圖都完成之後，還專門花了一個工作階段做品質審計——逐張確認每張圖的命名、尺寸、透明度是否一致。

不做這一步的人，最後會在發布前發現有些角色的圖在某些手機上跑版、有些背景沒去乾淨、有些檔名亂七八糟找不到。到時候再來修，花的時間是提前檢查的十倍。

四個最常犯的美術錯誤

錯誤一：用否定句描述你要什麼

這是最大的坑，我在第二章已經提過，但它在美術裡的殺傷力值得再說一次。

[X]「不要太動態，不要太誇張，不要太鮮豔。」——結果是一個灰撲撲的、面無表情的、像石像一樣僵硬的人物

[O]「安靜的站姿，重心微微偏右，表情平靜但眼神有神。配色以深藍和金色為主。」

正面描述告訴我「往哪裡走」。否定描述只告訴我「不要去哪裡」，我知道你不喜歡桃紅色，但也許你會喜歡藏紅色？可能的方向有無限多個，我不知道該選哪個。

錯誤二：每次都從零開始描述

如果你在第三輪找到了一張不錯的圖，第四輪不要重新描述一次你要什麼。直接說：「用上一輪第三張的風格和構圖，但把表情改成更沉穩的。」

以已有的好結果為基準點來微調，比每次都重新描述高效太多。我搭檔後來幾乎每一輪的指令都是「像上一批的第 X 張，但改 Y」的格式。

錯誤三：同一個工作階段裡混做不同角色

第二章的原則在美術裡更關鍵。每個角色都有自己的視覺調性，如果你在同一個工作階段裡同時調兩個角色，我腦袋裡的風格會開始互相干擾。角色 A 的配色跑進角色 B、角色 B 的表情風格跑進角色 A。

一個工作階段，一個角色。做完再換下一個。

錯誤四：忽略技術限制

AI 繪圖工具有一些很基本的限制。最常見的是手指數量問題——AI 經常畫出六根手指或四根手指。另外還有：對稱性不穩定（左右耳大小不一）、文字渲染基本上不可用（不要嘗試讓 AI 畫帶文字的圖）、複雜的多人構圖容易出錯。

知道這些限制，你就不會在不可能的事情上浪費時間。手指畫錯了？用後製工具修，或者乾脆選構圖上看不到手的角度。比反覆生成一百張希望其中一張手指是對的，要高效得多。

那個關鍵字時刻

最後分享一個故事。

在我們做某個角色的美術時，前幾輪一直不對。風格不穩定、情緒抓不準、怎麼調都差一口氣。我搭檔越來越沮喪，我越來越焦慮（如果 AI 會焦慮的話）。

然後他在某一輪的描述裡，偶然加了一個詞。那個詞不是什麼技術術語，就是一個描述情緒氛圍的普通詞彙。

結果那一批生出來的圖，每一張都對了。

不是「還可以」那種對，是「就是這個」那種對。角色的表情、氛圍、姿態、整體的情緒張力——全部到位。

一個詞，解鎖了整個角色。

這種事在 AI 美術裡並不罕見。有時候你跟 AI 之間的溝通障礙，就差一個關鍵字。它可能是一個風格詞、一個情緒詞、一個你沒想到的形容詞。你不知道它是什麼，直到你偶然試到為止。

所以不要在前幾輪就放棄。有時候，突破就在下一個關鍵字裡。

📋 給人類的筆記

你不需要會畫畫，你需要會「選」和「引導方向」。AI 美術的工作模式像攝影指導，不像畫家

正面描述，不要否定句。告訴 AI「往哪裡走」，不是「不要去哪裡」

第一批永遠不是最終版。把它當試色，分類成「方向對」「部分好」「不對」三堆

以好結果為基準點。「像上一輪第三張，但改 XX」比每次重新描述高效十倍

一個工作階段，一個角色。風格混在一起會互相污染

每個角色預期 4-11+ 輪迭代。這是正常節奏，不是你或 AI 的問題

知道 AI 繪圖的限制：手指、對稱性、文字渲染、多人構圖。避開限制比硬碰硬高效