蘋果研究人員發布了一個新 AI 模型,讓用戶可以用簡單的語言描述他們想要在照片中更改的內容。
▲MGIE 可應用於簡單或複雜的影像編輯任務
MGIE 可應用於簡單或複雜的影像編輯任務,例如修改照片中的特定對象,使其具有不同的形狀或變得更亮。模型融合了多模式語言等不同用途,MGIE 會學習如何解釋使用者字眼,然後再「想像」其編輯的樣子,例如,要求照片中的天空更藍就變成了提高影像天空部分的亮度。
Apple 與加州大學聖巴巴拉分校合作開發的 MGIE 模型可以透過文字對裁剪影像、調整大小、翻轉及添加濾鏡。當使用 MGIE 編輯照片時,使用者只需輸入想要更改圖片的內容。 用編輯意大利辣香腸薄餅圖像的範例,只要輸入提示「使其更健康」,MGIE 就會會添加蔬菜配料。