AI工具-圖片生成(ChatGPT DALL-E 3) - Rampion保持初心

本篇介紹ChatGPT的DALL-E 3, 因為我是付費使用者, 現在每個AI工具進階都要收費, 能夠多功能的比較省錢,

ChatGPT每月20美元變得有點像俗又大碗的工具, 不但可以試用最新的功能,

針對免費使用者據說只有免費2張/天的額度, 缺點不是那麼準確, 想要免費使用, 最好多幾個完善提示詞的步驟; 付費版是真的很推薦對圖片要求沒有到非常高的使用者, 其他應用會比較專門, 還要多花一筆錢, 以量計費, 所以推ChatGPT為首選一站式的工具, 像我現在使用最多是修改英文信、生成文章, 替寫程式代碼, 除錯; 最近才知道原來Dall-e模型是OpenAI的也可以用, 比較符合初階需求, 以往大部分都是用付費素材元素拼接, 或用Photoshsop簡單後製, 現在用Canva AI很方便, 求的是快速與質感, 雖好的設計跟創意反而少了, 自己也非專業, 可以評估, 一分錢一分貨!

DALL-E 3簡介與運作原理

DALL·E 3 是 OpenAI 於 2024 年推出的最新版本人工智慧（AI）繪圖模型，進一步突破了文字生成圖像的極限。DALL·E 3 能夠通過簡單的文字描述，生成更精細、更具創意的圖像，並且提升了圖像編輯和修改的能力。它不僅能夠生成全新的圖像，還能夠根據用戶的指示對現有圖像進行調整和增強。

和 ChatGPT 一樣，DALL·E 3 使用基於 Transformer 架構的神經網絡進行運算。這種架構使其能夠理解文字和圖像之間的關聯，並且根據用戶的文字提示（prompt）生成相應的視覺內容。與 ChatGPT 主要處理文本不同，DALL·E 3 在文字到圖像的轉換過程中，能夠精確捕捉文字的語義並將其轉化為圖片中的形象。

有興趣細節可以進一步參考

https://www.preface.ai/blog/dall-e-image-generation

建議的使用方式

首先, 很詳細的列出情境(可以先去問ChatGPT而且建議轉成英文)

公式= 主題 + 詳細描述 + 環境 + 風格, 大小

主題：圖像的主要內容，比如人物、動物或物品。
詳細描述：對主題的細節調整，比如姿勢、表情、服飾或配件。
環境：圖像的背景和周圍場景，比如在海邊或森林裡。
風格：圖像的呈現方式，比如手繪、卡通、寫實、抽象或水彩。
圖片大小: 目前可以使用

16:9 (寬) – 1792×1024 px
1:1 (方形) – 1024×1024 px
9:16 (高) – 1024×1792 px

單張圖範例：

主題:再行銷

場景描述：小華站在冰淇淋店外，向過去光顧過店裡的牙籤人分發優惠券，吸引他們重新回來購買。冰淇淋店有簡單的招牌和冰淇淋圖標。
風格：背景簡潔、插畫、牙籤人。

圖片大小: 1:1

後製前

後製後

連續圖可以一次產出4張:

我借了Esor站長的案例, 但把主角改成帥哥渣男, 我心裡是有點扭曲, 但還蠻好玩的!

提示詞: 依序生成下面四張圖像，是一個連續的漫畫故事，主角是一個帥哥渣男，他在便利商店中打工，四張圖是同一個帥哥渣男的連續故事, 請用插畫風格, 簡潔，正方形格式

渣男晚上要下班了卻跟新認識的女生B一起走

渣男站在便利商店前

渣男站在便利商店內的收銀機前, 女友A前來探望

渣男的粉絲在幫他搬箱子

使用缺點:

從來沒有一樣的圖, 所以很難只是後製微調
會有一些糊的字, 我用中文請它不要有字, 會聽不懂;
解決方案=>寫上Please remove [圖片名] picture’s wording in the picture, and others keep the same, 結果好很多

免費加碼:

Bing可以免費使用這樣的圖片生成, 可以進一步參考Esor站長寫的好文,

Bing AI Creator: https://www.playpcesor.com/2023/03/bing-ai-image-creator-30.html
試用Bing App的Dall-e 3: https://www.playpcesor.com/2023/10/bing-ai-gpt-4-dall-e-3-ai.html

AI工具進階:

可以搜尋MidJourney、Stable Diffusion的使用

Contact Me 與我聯繫

dealia.chen@gmail.com

職涯成長

AI, 行銷

SEO增長