久久精品一区二区三区四区_国产91久久久久久久免费_99免费在线视频_亚洲免费成人网

Stable Diffusion 3 來了:生成圖片文字終于不亂碼了

人工智能
2024
02/24
17:34
機器之心
分享
評論

來源:機器之心

繼 OpenAI 的 Sora 連續一周霸屏后,昨晚,生成式 AI 頂級技術公司 Stability AI 也放了一個大招 —— Stable Diffusion 3。該公司表示,這是他們最強大的文生圖模型。

與之前的版本相比,Stable Diffusion 3 生成的圖在質量上實現了很大改進,支持多主題提示,文字書寫效果也更好了。以下是一些官方示例:

提示:史詩般的動漫作品,一位巫師在夜晚的山頂上向漆黑的天空施放宇宙咒語,咒語上寫著 "Stable Diffusion 3",由五彩繽紛的能量組成(Epic anime artwork of a wizard atop a mountain at night casting a cosmic spell into the dark sky that says "Stable Diffusion 3" made out of colorful energy)

提示:電影照片,教室的桌子上放著一個紅蘋果,黑板上用粉筆寫著 "go big or go home" 的字樣(cinematic photo of a red apple on a table in a classroom, on the blackboard are the words "go big or go home" written in chalk)

提示:一幅畫,畫中宇航員騎著一只穿著蓬蓬裙的豬,撐著一把粉色的傘,豬旁邊的地上有一只戴著高帽的知更鳥,角落里有 "stable diffusion" 的字樣(a painting of an astronaut riding a pig wearing a tutu holding a pink umbrella, on the ground next to the pig is a robin bird wearing a top hat, in the corner are the words "stable diffusion")

提示:黑色背景上變色龍的攝影棚特寫(studio photograph closeup of a chameleon over a black background)

此外,Stability AI 媒體主管也曬出了一些生成效果:

Stability AI 表示,Stable Diffusion 3 是一個模型系列,參數量從 800M 到 8B 不等。這個參數量意味著,它可以在很多便攜式設備上直接跑,大大降低了 AI 大模型的使用門檻。

此外,Stability AI 還透露,他們和 Sora 一樣,在新模型中采用了 diffusion transformer 架構,并在博客中鏈接了 William ( Bill ) Peebles 和謝賽寧合著的 DiT 論文。這篇論文目前的被引量是 201,今年有望大幅增長。

不過,現在,Stable Diffusion 3 還沒有全面開放,權重也沒有公布。團隊提到,他們正在采取一些安全措施,防止不法分子濫用。

該公司首席執行官 Emad Mostaque 在 X 平臺的帖子中提到,在得到反饋并進行改進后,他們會把該模型開源。

很多人可能會好奇,這個 Stable Diffusion 3 和 DALLE 3、Midjourney 比效果如何?有些人做了測試,看起來似乎沒有拉開明顯差距。不過,Stable Diffusion 3 是開源領域的希望。

值得注意的是,在 Stable Diffusion 3 發布的同一時間,外媒還傳出了 Stability AI 旗下圖像生成應用公司 Clipdrop 被收購的消息。總部位于巴黎的 Clipdrop 成立于 2020 年 7 月,使用開源 AI 模型允許用戶生成和編輯照片。在 2023 年 3 月以未披露的金額出售給 Stability AI 之前,它已從 Air Street Capital 籌集了種子投資。當時,Clipdrop 表示它擁有超過 1500 萬用戶。但僅僅一年之后,Stability AI 就將它賣給了美國寫作助理初創公司 Jasper。

有人評價說,Stable Diffusion 3 的發布就是在掩蓋這個消息。和很多 AI 創業公司一樣,Stability AI 面臨的困境在于其以驚人的速度燒錢,但卻沒有明確的盈利途徑。去年年底,該公司還傳出了 CEO 可能被投資者趕下臺的消息,公司本身可能也在尋求賣身。在這樣的背景下,Stability AI 迫切地需要提振投資者信心。

英國媒體評價說,這筆交易標志著 Stability AI 戰略的逆轉。Emad Mostaque 在一份電子郵件聲明中表示,這筆交易將使該公司能夠繼續專注于開發 " 尖端的開放模型 "。在 Stable Diffusion 3 的相關博客中,該公司也強調," 我們對確保生成式人工智能開放、安全和普遍可及的承諾仍然堅定不移。" 目前看來,Stability AI 的前途仍不明朗。

Stable Diffusion 3 背后的技術:Diffusion Transformer+Flow Matching

在博客中,Stability AI 公布了打造 Stable Diffusion 3 的兩項關鍵技術:Diffusion Transformer 和 Flow Matching。

1. Diffusion Transformer

Stable Diffusion 3 使用了類似于 OpenAI Sora 的 Diffusion Transformer 框架,而此前幾代 Stable Diffusion 模型僅依賴于擴散架構。

Diffusion Transformer 是 Sora 研發負責人之一 Bill Peebles 與紐約大學助理教授謝賽寧最初在 2022 年底發布的研究,2023 年 3 月更新第二版。

論文探究了擴散模型中架構選擇的意義,研究表明 U-Net 歸納偏置對擴散模型的性能不是至關重要的,并且可以很容易地用標準設計(如 Transformer)取代。

論文鏈接:https://arxiv.org/pdf/2212.09748.pdf

具體來說,論文提出了一種基于 Transformer 架構的新型擴散模型 DiT,并訓練了潛在擴散模型,用對潛在 patch 進行操作的 Transformer 替換常用的 U-Net 主干網絡。他們通過以 Gflops 衡量的前向傳遞復雜度來分析擴散 Transformer(DiT)的可擴展性,各個型號的 DiT 都取得了不錯的效果。

我們都知道,擴散模型的成功可以歸功于它們的可擴展性、訓練的穩定性和生成采樣的多樣性。在擴散模型的范圍內,所使用的骨干架構存在很大差異,包括基于 CNN 的、基于 Transformer 的、CNN-Transformer 混合,甚至是狀態空間模型。

用于擴展這些模型以支持高分辨率圖像合成的方法也各不相同,現有方法或是增加了訓練的復雜性,或是需要額外的模型,或是犧牲了質量。潛在擴散是實現高分辨率圖像合成的主要方法,但在實踐中無法表現精細細節,影響了采樣質量,限制了其在圖像編輯等應用中的實用性。其他高分辨率圖像合成方法還有級聯超分辨率、多尺度損失、增加多分辨率的輸入和輸出,或利用自調節和適應全新的架構方案。

基于 DiT 的啟發,Stability AI 進一步提出了 Hourglass Diffusion Transformer ( HDiT ) 。這是一種隨像素數量擴展的圖像生成模型,支持直接在像素空間進行高分辨率(如 1024 × 1024)訓練。

這項工作通過改進骨干網絡解決了高分辨率合成問題。Transformer 架構可以擴展到數十億個參數,HDiT 在此基礎上,彌補了卷積 U-Net 的效率和 Transformer 的可擴展性之間的差距,無需使用典型的高分辨率訓練技術即可成功進行訓練。

論文鏈接:https://arxiv.org/pdf/2401.11605.pdf

研究者引入了一種 "pure transformer" 架構,獲得了一種能夠在標準擴散設置中生成百萬像素級高質量圖像的骨干結構。即使在 128 × 128 等低空間分辨率下,這種架構也比 DiT 等常見 Diffusion Transformer 骨干網絡(圖 2)的效率高得多,在生成質量上也具有競爭力。另一方面,與卷積 U-Nets 相比,HDiT 在像素空間高分辨率圖像合成的計算復雜度方面同樣具備競爭力。

2. Flow Matching

使用 Flow Matching 技術的意義則在于提升采樣效率。

深度生成模型能夠對未知數據分布進行估計和采樣。然而,對簡單擴散過程的限制導致采樣概率路徑的空間相當有限,從而導致訓練時間很長,需要采用專門的方法進行高效采樣。在這項工作中,研究者探討了如何建立連續標準化流程的通用確定性框架。

這項究為基于連續歸一化流(CNF)的生成建模引入了一種新范式,實現了以前所未有的規模訓練 CNF。

論文鏈接:https://arxiv.org/pdf/2210.02747.pdf

具體來說,論文提出了 "Flow Matching" 的概念,這是一種基于固定條件概率路徑向量場回歸訓練 CNF 的免模擬方法。Flow Matching 與用于在噪聲和數據樣本之間進行轉換的高斯概率路徑的通用族兼容(通用族將現有的擴散路徑歸納為具體實例)。

研究者發現,使用帶有擴散路徑的 Flow Matching 可以為擴散模型的訓練提供更穩健、更穩定的替代方案。

此外,Flow Matching 還為使用其他非擴散概率路徑訓練 CNF 打開了大門。其中一個特別值得關注的例子是使用最優傳輸(OT)位移插值來定義條件概率路徑。這些路徑比擴散路徑更有效,訓練和采樣速度更快,泛化效果更好。在 ImageNet 上使用 Flow Matching 對 CNF 進行訓練,在似然性和采樣質量方面的性能始終優于其他基于擴散的方法,并且可以使用現成的數值 ODE 求解器快速、可靠地生成采樣。

THE END
廣告、內容合作請點擊這里 尋求合作
ai
免責聲明:本文系轉載,版權歸原作者所有;旨在傳遞信息,不代表砍柴網的觀點和立場。

相關熱點

9 月 17 日消息,紐約郵報 9 月 12 日發布博文,報道稱在印度航空 AI171 航班空難造成 241 人遇難后,兩位印度工程師推出“重生計劃”(Project REBIRTH)原型機,號稱是全球首個 AI 驅動的飛機墜機生存系...
業界
9月16日,脈脈最新發布的《2025年AI人才流動報告》顯示,今年1-7月,平臺AI新發崗位量同比增長超10倍,簡歷投遞量同比增長11倍。
業界
北京時間9月16日,彭博社周一發文稱,一度隱退的阿里創始人馬云“強勢回歸”,在公司戰略決策中的作用越來越大。
業界
北京時間9月10日,據科技網站TheVerge報道,蘋果備受期待的秋季發布會帶來了關于AirPods、Apple Watch、iPhone等多項硬件的更新消息。
業界
9 月 7 日消息,上月初,彭博社曾報道蘋果正在開發一款自研生成式 AI 搜索產品,并為此組建了全新的“答案、知識與信息”團隊。
業界

相關推薦

1
3
久久精品一区二区三区四区_国产91久久久久久久免费_99免费在线视频_亚洲免费成人网

    9000px;">

      爽好久久久欧美精品| 亚洲国产wwwccc36天堂| 精品区一区二区| 欧美大片在线观看| 欧美一区二区三区在线观看| 在线播放91灌醉迷j高跟美女 | 在线观看91av| 欧美撒尿777hd撒尿| 色妞www精品视频| 日本久久精品电影| 91豆麻精品91久久久久久| 99精品热视频| 色婷婷综合久色| 欧美性xxxxx极品少妇| 欧美三级日韩三级| 色综合久久88色综合天天6| 一本一本大道香蕉久在线精品| 91丨九色丨尤物| 欧美午夜一区二区三区免费大片| 欧美日本精品一区二区三区| 日韩欧美在线1卡| 久久这里只精品最新地址| 国产日韩欧美精品在线| 国产精品久久久久桃色tv| 亚洲另类一区二区| 日韩成人免费看| 成人av在线一区二区三区| 色欧美乱欧美15图片| 欧美精品乱码久久久久久| 26uuu亚洲综合色欧美 | 日韩va亚洲va欧美va久久| 国产一区二区在线观看视频| 成人精品gif动图一区| 日本高清免费不卡视频| 日韩视频在线永久播放| 中文字幕av一区 二区| 亚洲国产欧美日韩另类综合| 国内精品久久久久影院薰衣草| 一本大道久久a久久综合婷婷 | 国产精品毛片大码女人| 日韩av一区二区三区| 成人av在线资源网站| 欧美日韩精品一区二区三区| 国产欧美日韩精品a在线观看| 亚洲午夜精品一区二区三区他趣| 黄色精品一二区| 欧美日韩国产电影| 亚洲欧洲av在线| 捆绑变态av一区二区三区| 日本久久一区二区三区| 久久人人97超碰com| 亚洲一区二区三区国产| 国产91丝袜在线播放| 欧美一区二区网站| 一区二区三区鲁丝不卡| 成人小视频在线观看| 欧美一区二区三区在| 亚洲一区自拍偷拍| 成人精品视频一区| 亚洲精品一区二区三区精华液 | 日韩精品国产欧美| 在线视频你懂得一区| 国产精品久久久久久妇女6080| 免费的国产精品| 欧美嫩在线观看| 一区二区不卡在线视频 午夜欧美不卡在| 国产一区二区免费看| 91精品综合久久久久久| 天天影视涩香欲综合网| 色综合久久六月婷婷中文字幕| 国产日韩欧美在线一区| 国产成人av福利| 国产日韩欧美一区二区三区综合| 国内精品久久久久影院色 | 风间由美性色一区二区三区| www久久精品| 国产一区二区精品久久99| 日韩午夜激情免费电影| 久久疯狂做爰流白浆xx| 日韩视频免费观看高清完整版在线观看 | 亚洲综合免费观看高清完整版 | 久久精品日产第一区二区三区高清版| 极品少妇一区二区三区精品视频| 日韩一区二区在线看| 日本欧美大码aⅴ在线播放| 日韩欧美在线一区二区三区| 精品一区二区三区在线播放视频 | 欧美日韩视频在线第一区 | 精品婷婷伊人一区三区三| 亚洲国产欧美在线人成| 欧美一级夜夜爽| 国产精品99久久久久久久vr| 欧美激情综合五月色丁香| 色国产综合视频| 美女一区二区三区在线观看| 久久一区二区三区国产精品| jlzzjlzz欧美大全| 亚洲成人综合视频| 精品国产乱码久久久久久牛牛| 国产一区二区久久| 国产精品白丝在线| 欧美日韩国产一二三| 国产中文字幕一区| 亚洲人成网站影音先锋播放| 在线播放国产精品二区一二区四区| 久久精品国产澳门| 亚洲欧美日韩小说| 欧美精品一区二区在线播放| 91亚洲永久精品| 老汉av免费一区二区三区| **网站欧美大片在线观看| 91精品国产综合久久蜜臀| 成熟亚洲日本毛茸茸凸凹| 日本在线观看不卡视频| 国产精品无码永久免费888| 欧美日韩日本视频| 成人午夜av影视| 日韩av一区二| 一级日本不卡的影视| 久久欧美一区二区| 欧美亚洲一区二区在线观看| 高清beeg欧美| 久久精品国产网站| 亚洲成人自拍一区| 国产精品欧美久久久久无广告 | 精品99999| 欧美色视频在线| 成人美女视频在线观看| 蜜臀av性久久久久蜜臀aⅴ| 亚洲欧美日韩小说| 国产女主播视频一区二区| 精品日韩一区二区三区| 欧美天堂一区二区三区| 97精品久久久午夜一区二区三区| 国产精品一区久久久久| 日韩1区2区3区| 婷婷中文字幕综合| 亚洲激情中文1区| 亚洲欧美一区二区三区国产精品| 国产欧美中文在线| 久久久久久久久97黄色工厂| 日韩无一区二区| 欧美v国产在线一区二区三区| 91.com在线观看| 欧美一区二区国产| 日韩写真欧美这视频| 91麻豆精品国产91久久久久久 | 东方欧美亚洲色图在线| 国产精品456露脸| 久久9热精品视频| 免费日本视频一区| 美女免费视频一区二区| 日日摸夜夜添夜夜添亚洲女人| 亚洲一区二区三区四区中文字幕| 亚洲欧美日韩中文播放| 亚洲欧美在线观看| 1000部国产精品成人观看| 亚洲精品成人少妇| 亚洲精品视频自拍| 亚洲男人的天堂在线观看| 亚洲乱码中文字幕| 一区二区三区在线视频免费观看| 一区二区三区国产| 亚洲成人免费av| 免费高清在线一区| 成人国产精品免费观看动漫| 不卡av在线网| 欧美系列日韩一区| 精品欧美乱码久久久久久1区2区| 久久欧美一区二区| 亚洲品质自拍视频| 亚洲美女在线国产| 日韩精品电影一区亚洲| 另类的小说在线视频另类成人小视频在线| 久久精品av麻豆的观看方式| 国产福利91精品| 欧美午夜精品一区二区蜜桃| 欧美一区二区国产| 亚洲欧美自拍偷拍色图| 天天色 色综合| 国产精品系列在线观看| 91热门视频在线观看| 欧美日韩一区视频| 久久久国产精华| 亚洲成人自拍偷拍| 国产真实乱对白精彩久久| 色悠悠久久综合| 日韩精品一区二区三区三区免费 | 国产精品正在播放| 欧美美女网站色| 国产网红主播福利一区二区| 一区二区三区成人| 国产精品69久久久久水密桃| 欧美日韩欧美一区二区| 国产拍揄自揄精品视频麻豆| 日韩中文欧美在线| 97久久精品人人爽人人爽蜜臀| 7777精品伊人久久久大香线蕉| 国产精品三级久久久久三级| 日韩精品一级中文字幕精品视频免费观看 |