top of page
作家相片Simmy Lee

Stable Diffusion SDXL Beta 模型 | Chamotrans 洋甘菊翻譯 | 香港翻譯公司







Stability AI 新發佈一個名為 SDXL Beta(Stable Diffusion XL Beta)的新模型預覽版本。雖然他們沒有告訴我們太多關於這個模型的資料,但其目前提供予任何希望測試的人士。


這個 Stable Diffusion SDXL 模型有甚麼新的特點?其優點和缺點是甚麼?讓我們來探索一下。

目錄















甚麼是 SDXL 模型?


SDXL 模型是一個新模型目前正在訓練中。其仍是未完成的模型。事實上,當其發布時,其甚至可能不稱為 SDXL 模型。


我們所知道的是其為一個更大的模型,具有更多的參數和一些未具體指明的改進。該模型是一個 v2 模型,而不是 v3 模型(不管那意味著甚麼)。


如何使用 SDXL 模型


SDXL 模型目前可在 Stability AI 的官方影像建立工具 Dream Studio 中使用。如要使用 SDXL 模型,請在模型選單中選擇 SDXL Beta。





在 DreamStudio 中選擇 SDXL Beta 模型。


您需要註冊才能使用模型。註冊後您將獲得一些免費積分。


改進


我將強調我迄今為止在 SDXL 模型中看到的一些改進。


可辨識的文字


也許最引人注目的能力是建立易讀的文本。這在 v1 或 v2.1 模型中是不可能的。


SDXL 所建立的文本並不總是準確的(正如您在下面的Stable Diffusion文本中所看到的)。但其比 v2.1 好得多,更不用說 v1 模型了。


一張女人坐在餐廳裡拿著寫著「菜單」的菜單的照片。





一名男子手持一個寫有「Stable Diffusion」字樣的牌子的照片。





一位年輕女性手持寫有「Stable Diffusion」字樣的牌子,頭髮上有亮點,坐在餐廳外,棕色眼睛,穿著裙子,側光。





更好的「人體結構」


Stable Diffusion長期存在建立正確人體結構的問題。常見的是看到額外或缺失的肢體。通常會使用修補畫面來進行更正。或者,最近更可以使用 ControlNet 的 Open Pose 功能從參考圖像中複製姿勢。


我很高興看到 SDXL Beta 模型在這個領域有所改進。讓我們看看以下一個例子。


指令如下:


一名穿著瑜珈服的女子,三角式姿勢,傍晚的海灘,邊緣照明的照片


以下是 SDXL Beta 圖像。






與下面的 v1.5 圖像進行比較。






雖然並不完美,但 SDXL 中的人物姿勢變得更好了!


更多美學圖像


建立的圖像可能會非常不同。請參閱以下具有相同提示的圖像。


v1.5v2.2.2 SDXL Beta


照片風格的人像在 SDXL Beta 中非常好。我會說效果比 v1.5 更好。


女性的照片拍攝



v1.5




v2.2.2 SDXL Beta




v1.5




v2.2.2 SDXL Beta


更精確的圖像


理解提示的能力在 v1 模型上獲得改進。


在 v1.5 模型中,關鍵字「雙色調」總是建立黑白圖像。SDXL Beta 建立具有各種顏色的雙色調圖像。這是一個改進。


一張女性的雙色調人像照片

v1.5




v2.2.2 SDXL Beta


由於 SDXL Beta 是 v2 模型,其配備了更大的文本模型。您可以期望其比 v1 模型更好地理解您的提示。實際上,這就是我們所看到的。


讓我們看看以下提示產生的兩個主題的圖像。


大型機械人朋友坐在人類旁邊,像《攻殼機動隊》風格,動漫桌布



v1.5





v2.2.2 SDXL Beta


v1.5 模型一貫地忽略了提示中有兩個主體,機械人和人類。但是 SDXL Beta 模型能夠理解提示並建立更正確的圖像。(我希望機械人可以變得更大,但這是一個進步。)


同樣地,照片風格的圖像更加精確。請參閱以下提示和圖像。


一個年輕男子,頭髮有亮點,棕色眼睛,穿著白色襯衫和藍色牛仔褲,在海灘上,背景是一座火山。



v1.5





v2.2.2 SDXL Beta


藝術風格


我查看了幾種藝術風格。有些微妙的變化,但我不能說其更好或更差,單純是有所不同。


無論是 v1.5 還是 SDXL Beta 都能建立愛德華 · 霍普風格,儘管有著不同之處。


愛德華 · 霍普筆下的紐約市



v1.5




v2.2.2 SDXL Beta


v1.5 可以精確地建立列奧尼德 · 阿弗列莫夫的風格。在 SDXL Beta 中,獨特的彩色板刷筆觸缺失了。其建立了一種插圖風格,有趣的是,仍然保留了地面上的明顯反射。


列奧尼德 · 阿弗列莫夫筆下的紐約市




v1.5



v2.2.2 SDXL Beta


v1.5 和 SDXL Beta 都能夠產生接近 William-Adolphe Bouguereau 風格的作品。SDXL Beta 的圖像更接近 Bouguereau 所創作的典型學術繪畫。一般來說,SDXL Beta 的人像畫在臉部呈現更多細節。


威廉-阿道夫 · 布格羅筆下的美麗女人人像






v1.5






v2.2.2 SDXL Beta


風格轉換


也許這只是預覽模式的故障。有時候,只要加入一些不相干的關鍵詞,風格就會突然改變。


例如,我從這個提示開始建立照片風格。


一個年輕男子,頭髮有亮點,棕色眼睛,穿著白色襯衫和藍色牛仔褲,在海灘上,背景是一座火山。





現在我想要加一條黃色的圍巾。


一個年輕男子,頭髮有亮點,棕色眼睛,戴著黃色圍巾,穿著白色襯衫和藍色牛仔褲,在一個有火山背景的海灘上。





突然間,圖像變成了動漫風格。這發生在一些關鍵詞上。情況就像模型已經融合了一些卡通風格,渴望轉換到那個風格一樣。


希望這個問題能在發行版本中解決。


印象


這是我對 SDXL Beta 模型的看法:


Stable Diffusion 終於能建立正確的文字!


比 v2.1 模型更具美感,且比 v1.5 模型(稍為)更具美感。


圖像比提示中描述的更準確。


人體結構越來越好。


不需要像 v2.1 那樣多負面提示


特別擅長人像畫。


於發布之前仍有待修復一些奇怪的模型故障。


最後,附上 SDXL beta 模型的幾張圖片:













107 次查看0 則留言

Comments


bottom of page