自從收購 OpenAI 後, Microsoft 在 AI 方面的發展在 ChatGPT 的幫助下一日千里,最近更加入了類似 Midjourney 的文字生成圖片服務—— Bing Image Creator。
Bing Image Creator 由 OpenAI 的 DALL-E 驅動。Microsoft 表示 Image Creator 現時使用的是 DALLE-E 最新版本,Microsoft Edge 瀏覽器側邊導覽欄已經可以使用這項新功能。
現時雖然尚未對香港用戶開放,但小編已為大家準備了教學,分享如何可以登記試玩。你能夠猜到以下哪張圖片是由 Bing Image Creator 生成,哪張是由 Midjourney 生成嗎?答案會在下文開估。
▲ 第一組
▲ 第二組
▲ 第三組
2 步搶先試玩 Bing Image Creator
Step 1 註冊 Microsoft 帳戶
開啟 VPN 使用美國 IP 後,可以到 Microsoft 官網註冊帳戶,登記使用新 Bing。
Microsoft 帳戶註冊連結:https://signup.live.com/signup
▲ Microsoft 帳戶註冊頁面
進入 Bing Image Creator 頁面
▲ 點擊粉紅色的「加入並創作按鈕」
Step 2 開始使用
完成登記後就可以開始使用 Bing Image Creator 了。
Bing 影像建立者連結:https://www.bing.com/create
▲ Bing Image Creator 主頁面
▲還未想到生成甚麼圖片嗎?你可以按畫面頂部右上角(綠色框示)的「給我驚喜」按鈕,讓 Bing Image Creator 隨機生成一句 Prompt 給你。按下「給我驚喜」按鈕後, Bing Image Creator 並不會自動生成圖片,你需要再按建立,它才會替你生成使用該句 Prompt 的圖片。
▲ 你可以在輸入欄裏輸入你想生成甚麼圖片,再按旁邊粉紅色的建立鍵。綠色圈內的數字代表尚餘快速生成次數,預設為 10 次,Microsoft 表示用完後仍然可以繼續玩,只是速度會稍慢。
▲ 用完所有次數後會顯示這個畫面,Bing 表示需要等候 5 分鐘,小編實測後發現超過 20 分鐘也未能生成。
小編輸入了以下的 Prompt:
A cute cartoon Shiba Inu is standing upright on a grassy field, with blue sky, white clouds, and sunlight shining down. The green grass is lush, creating a cheerful and sunny atmosphere. The Shiba Inu is wearing adorable clothes and is tilting its head with a big smile on its face. The scene is cinematic and hyper-detailed, with insane details and beautifully color-graded visuals. The Unreal Engine is used with depth-of-field, super-resolution, megapixel, cinematic lightning, anti-aliasing, FKAA, TXAA, RTX, SSAO, post-processing, post-production, tone mapping, CGI, VFX, and SFX. The visuals are insanely detailed and intricate, with a hyper maximalist and hyper-realistic style that includes volumetric and photorealistic elements. The level of detail is ultra photoreal and ultra-detailed, with intricate details that are showcased in 8K resolution with full color and volumetric lightning. The scene is created with HDR and a realistic look, powered by the Unreal Engine at 16K resolution with sharp focus
▲ 按建立後會跳至等候畫面
看到這裡的讀者就會知道小編文章開頭的圖片哪張是由 Bing Image Creator 生成了。全部 3 組的答案都是左邊,右邊那張是由 Midjourney 生成的。
▲ 十數秒後,Bing Image Creator 就會依照你調要求生成圖片
與 Midjourney 不同的地方是, Bing Image Creator 一次就會生成 4 張獨立大圖供用戶選擇,但不能叫它跟從一張圖片的風格再生成新的圖片。
▲ 點擊你想要的圖片後就會跳至這頁面,你可以選擇分享、儲存或下載。
實測 Bing Image Creator
Microsoft 表示用家可以叫 Bing Image Creator 生成各種風格的圖片,小編用以下的 Prompt 嘗試叫 Bing Image Creator 生成一張 16 bit 風格的藝術圖片。
16bit cityscape, night, hong kong, neonlight, crowded, backalley, wet, dirty, background high rise building, rats on ground, cyberpunk,
要注意的是,Bing Image Creator 對提示詞的規管似乎比 Midjourney 更嚴格。Microsoft 表示 Bing Image Creator 整合了 OpenAI 的安全措施,為 Bing Image Creator 增加了額外保護,限制用戶生成可能有害的圖片。小編在 Bing Image Creator 和 Midjoureny 輸入同一句 Prompt, Midjourney 能夠生成圖片,但 Bing Image Creator 會彈出警告,似乎以 Bing Image Creator 的道德底線而言,比堅尼也算過火了。
two women in bikini holding hands walking on a beach, sunset in the background, photorealistic
▲ Midjourney 生成的圖片
▲ Bing Image Creator 彈出的警告
現階段暫時不建議使用 Bing Image Creator 生成人像圖片,除了因為 Bing Image Creator 的道德底線很高,很容易「誤觸紅線」導致帳戶被禁外,還有其質素也有待改進。由於生成不了比堅尼照片,小編叫 Bing Image Creator 改為生成穿短裙的女生照。
▲ 只看縮圖的話看似沒有甚麼問題,但放大後小編被嚇了一跳。
▲ Bing Image Creator 生成的相中人看起來很恐怖,表情猙獰。
除了表情和五官問題外,Bing Image Creator 和 v4 Midjourney 面對一樣的問題,就是手的部分時常「炒車」,多了或缺了手指,以及經常出現奇怪比例。
▲ Bing Image Creator生成的圖片,明顯可見手指比例奇怪,和手指數量不是五隻。
總結
Microsoft 新推出的 Bing Image Creator 能夠生成各種風格的圖片,而且能夠辨認並生成知名品牌(如可口可樂);不過「道德底線」偏高,提示詞很容易誤觸紅線,而且生成人像方面,暫時仍然比 Midjourney 落後。