谷歌最強(qiáng)大的文生圖大模型 Imagen 2,可提供與用戶提示詞緊密結(jié)合且一致的高質(zhì)量、逼真的圖像輸出。它可以通過使用訓(xùn)練數(shù)據(jù)的自然分布來生成更逼真的圖像,而不是采用預(yù)先編程的風(fēng)格。
谷歌的增強(qiáng)模型 Imagen 2是利用谷歌旗艦人工智能實(shí)驗(yàn)室Google DeepMind的技術(shù)開發(fā)的,該模型在5月份的科技巨頭 I/O大會(huì)上悄悄推出了預(yù)覽版。谷歌聲稱,與第一代Imagen相比,它在圖像質(zhì)量方面“顯著”提高,并引入了新功能,包括渲染文本和Logo的能力。
“Imagen 2 可以生成……徽章、字母標(biāo)記和抽象徽標(biāo)……[并且]能夠?qū)⑦@些徽標(biāo)覆蓋到產(chǎn)品、服裝、名片和其他表面上。”
得益于“新穎的訓(xùn)練和建模技術(shù)”,Imagen 2還可以理解更具描述性的長(zhǎng)格式提示,并對(duì)有關(guān)圖像中元素的問題提供“詳細(xì)答案”。谷歌表示,這些技術(shù)還增強(qiáng)了 Imagen 2的多語(yǔ)言理解能力——允許模型將一種語(yǔ)言的提示翻譯成另一種語(yǔ)言的輸出(例如Logo)。
Imagen 2利用SynthID(DeepMind開發(fā)的一種方法)將隱形水印應(yīng)用到其創(chuàng)建的圖像上。當(dāng)然,檢測(cè)這些水?。ü雀杪暦Q這些水印能夠適應(yīng)圖像編輯,包括壓縮、濾鏡和顏色調(diào)整)需要谷歌提供的工具,而第三方無法使用該工具。