本篇只介紹ChatGPT的DALL-E 3, 因為我是付費使用者, 現在每個AI tool想要進階都要收費,

ChatGPT每月20美元變得有點像俗又大碗的工具, 不但可以試用最新的功能,

針對免費使用者據說只有免費2張/天的額度, 不過好像不是那麼準確, 想要免費使用, 最好多幾個完善提示詞的步驟; 付費版是真的很推如果對圖片要求沒有到非常高, 因為其他的應用都比較專門, 還要多花一筆錢, 以量計費, 但一站式的像我現在使用最多是修改英文信、生成文章, 替寫程式代碼, 除錯; 最近才知道原來Dall-e模型是OpenAI的也可以用, 自己要求不是太高, 以往大部分都是用付費素材元素拼接, 本還會用Photoshsop簡單後製, 現在直接Canva AI, 求的是快速與質感, 當然好的設計跟創意反而少了, 自己也非專業, 可以評估, 一分錢一分貨!

DALL-E 3簡介與 運作原理

DALL·E 3 是 OpenAI 於 2024 年推出的最新版本人工智慧(AI)繪圖模型,進一步突破了文字生成圖像的極限。DALL·E 3 能夠通過簡單的文字描述,生成更精細、更具創意的圖像,並且提升了圖像編輯和修改的能力。它不僅能夠生成全新的圖像,還能夠根據用戶的指示對現有圖像進行調整和增強。

和 ChatGPT 一樣,DALL·E 3 使用基於 Transformer 架構的神經網絡進行運算。這種架構使其能夠理解文字和圖像之間的關聯,並且根據用戶的文字提示(prompt)生成相應的視覺內容。與 ChatGPT 主要處理文本不同,DALL·E 3 在文字到圖像的轉換過程中,能夠精確捕捉文字的語義並將其轉化為圖片中的形象。

有興趣細節可以進一步參考

https://www.preface.ai/blog/dall-e-image-generation

本篇提供建議的使用方式

首先, 很詳細的列出情境(可以先去問ChatGPT而且建議轉成英文)

公式= 主題 + 詳細描述 + 環境 + 風格, 大小

主題:圖像的主要內容,比如人物、動物或物品。
詳細描述:對主題的細節調整,比如姿勢、表情、服飾或配件。
環境:圖像的背景和周圍場景,比如在海邊或森林裡。
風格:圖像的呈現方式,比如手繪、卡通、寫實、抽象或水彩。
圖片大小: 目前可以使用

16:9 (寬) – 1792×1024 px
1:1 (方形) – 1024×1024 px
9:16 (高) – 1024×1792 px

單張圖範例:

主題:再行銷

場景描述:小華站在冰淇淋店外,向過去光顧過店裡的牙籤人分發優惠券,吸引他們重新回來購買。冰淇淋店有簡單的招牌和冰淇淋圖標。
風格:背景簡潔、插畫、牙籤人。

圖片大小: 1:1

後製前

後製後

連續圖可以一次產出4張:

我借了Esor站長的案例, 但把主角改成帥哥渣男, 我心裡是有點扭曲, 但還蠻好玩的!

提示詞: 依序生成下面四張圖像,是一個連續的漫畫故事,主角是一個帥哥渣男,他在便利商店中打工,四張圖是同一個帥哥渣男的連續故事, 請用插畫風格, 簡潔,正方形格式

  1. 渣男站在便利商店前
  2. 渣男站在便利商店內的收銀機前, 女友A前來探望
  3. 渣男的粉絲在幫他搬箱子
  4. 渣男晚上要下班了卻跟新認識的女生B一起走

使用缺點:

免費加碼:

聽說Bing可以免費使用這樣的圖片生成, 可以進一步參考Esor站長寫的好文, 我就繼續用付費ChatGPT

Bing AI Creator: https://www.playpcesor.com/2023/03/bing-ai-image-creator-30.html

試用Bing App的Dall-e 3: https://www.playpcesor.com/2023/10/bing-ai-gpt-4-dall-e-3-ai.html

想要進階:

可以搜尋MidJourney、Stable Diffusion的使用