網(wǎng)友評分: 4.1分
Stable Diffusion是一款功能強(qiáng)大的AI繪畫軟件,并且在Github上開源,小編為大家找來了軟件的GUI版本,省去了本地部署步驟,解壓即可直接運(yùn)行生成各種圖像。軟件使用簡單便捷,用戶能夠自己電腦的配置自由的調(diào)整各種參數(shù),讓電腦自己作畫。
首先,從名字Stable Diffusion就可以看出,這個主要采用的擴(kuò)散模型(Diffusion Model)。
簡單來說,擴(kuò)散模型就是去噪自編碼器的連續(xù)應(yīng)用,逐步生成圖像的過程。
一般所言的擴(kuò)散,是反復(fù)在圖像中添加小的、隨機(jī)的噪聲。而擴(kuò)散模型則與這個過程相反——將噪聲生成高清圖像。訓(xùn)練的神經(jīng)網(wǎng)絡(luò)通常為U-net。
不過因?yàn)槟P褪侵苯釉谙袼乜臻g運(yùn)行,導(dǎo)致擴(kuò)散模型的訓(xùn)練、計(jì)算成本十分昂貴。
基于這樣的背景下,Stable Diffusion主要分兩步進(jìn)行。
首先,使用編碼器將圖像x壓縮為較低維的潛在空間表示z(x)。
其中上下文(Context)y,即輸入的文本提示,用來指導(dǎo)x的去噪。
它與時間步長t一起,以簡單連接和交叉兩種方式,注入到潛在空間表示中去。
隨后在z(x)基礎(chǔ)上進(jìn)行擴(kuò)散與去噪。換言之, 就是模型并不直接在圖像上進(jìn)行計(jì)算,從而減少了訓(xùn)練時間、效果更好。
值得一提的是,Stable DIffusion的上下文機(jī)制非常靈活,y不光可以是圖像標(biāo)簽,就是蒙版圖像、場景分割、空間布局,也能夠相應(yīng)完成。
標(biāo)簽: Stable Diffusion AI繪圖
關(guān)于本站|下載幫助|下載聲明|軟件發(fā)布|聯(lián)系我們
Copyright ? 2005-2024 hanheng168.com.All rights reserved.
浙ICP備2024132706號-1 浙公網(wǎng)安備33038102330474號