Prompt tạo hình ảnh AI: Midjourney, DALL-E, Stable Diffusion

Duy Nguyễn Duy Nguyễn 13 tháng 3, 2026 12 phút đọc
TL;DR: Prompt tạo hình ảnh AI hiệu quả cần bao gồm: chủ thể chính, phong cách nghệ thuật, góc chụp/ánh sáng, màu sắc, và chi tiết bổ sung. Mỗi platform (Midjourney, DALL-E, SD) có cách viết hơi khác nhau.

Tại sao viết prompt hình ảnh khác hoàn toàn prompt văn bản?

Nếu bạn đã biết viết prompt cho ChatGPT, bạn sẽ thấy prompt tạo hình ảnh là một “trò chơi” khác hẳn.

Với prompt văn bản, bạn viết: “Viết email chào hàng cho khách” — AI hiểu ngay.

Nhưng với prompt hình ảnh, nếu bạn chỉ viết: “Một quán cà phê” — AI sẽ cho ra hình ảnh rất… bình thường. Không có gì đặc biệt.

Lý do: AI tạo hình ảnh cần bạn mô tả bằng “ngôn ngữ thị giác” — phong cách, ánh sáng, góc chụp, màu sắc, mood. Đây là những thứ bạn ít khi nghĩ tới khi viết prompt văn bản.

Bài viết này sẽ hướng dẫn bạn viết prompt tạo hình ảnh trên 3 công cụ phổ biến nhất: Midjourney, DALL-E 3, và Stable Diffusion — kèm 20 mẫu prompt copy-paste dùng ngay.

Nếu bạn chưa biết prompt engineering là gì, đọc bài hướng dẫn đầy đủ trước nhé.

Cấu trúc prompt tạo hình ảnh cơ bản

Mọi prompt hình ảnh tốt đều có 5 thành phần chính. Hãy nghĩ như bạn đang “brief” cho một nhiếp ảnh gia hoặc hoạ sĩ:

1. Chủ thể (Subject) — Bạn muốn vẽ gì?

Đây là phần quan trọng nhất. Mô tả cụ thể đối tượng chính trong hình.

Mơ hồCụ thể
Một cô gáiCô gái Việt Nam 25 tuổi, tóc dài, mặc áo dài trắng
Quán cà phêQuán cà phê nhỏ góc phố Sài Gòn, có cây xanh, ghế gỗ vintage
Sản phẩmChai serum mặt thuỷ tinh 30ml trên nền đá cẩm thạch trắng

2. Phong cách (Style) — Hình trông như thế nào?

Phong cách quyết định “cảm giác” của hình ảnh. Một số phong cách phổ biến:

  • Photography — ảnh chụp chân thực
  • Watercolor — tranh màu nước
  • 3D render — hình 3D mịn màng
  • Flat illustration — minh hoạ phẳng (kiểu Canva)
  • Anime/Manga — phong cách hoạt hình Nhật
  • Oil painting — tranh sơn dầu cổ điển
  • Minimalist — tối giản
  • Cinematic — điện ảnh, đậm chất phim

3. Góc chụp và ánh sáng (Camera angle & Lighting)

Đây là yếu tố hay bị bỏ qua nhưng tạo khác biệt lớn:

Góc chụp:

  • close-up — cận cảnh
  • bird's eye view — nhìn từ trên xuống
  • low angle — góc thấp nhìn lên (tạo cảm giác hùng vĩ)
  • eye level — ngang tầm mắt
  • wide shot — toàn cảnh

Ánh sáng:

  • golden hour lighting — ánh nắng chiều vàng
  • soft natural light — ánh sáng tự nhiên dịu
  • studio lighting — đèn studio chuyên nghiệp
  • neon lighting — đèn neon rực rỡ
  • dramatic shadows — bóng đổ mạnh

4. Màu sắc (Color palette)

Chỉ định bảng màu giúp AI tạo hình ảnh đồng nhất với thương hiệu của bạn:

  • warm earth tones — tông nóng, màu đất
  • pastel colors — màu phấn nhẹ
  • black and gold — đen và vàng (sang trọng)
  • red and white — đỏ trắng (năng động)
  • muted colors — màu trầm, nhẹ nhàng

5. Chi tiết bổ sung (Details & Mood)

Thêm các yếu tố giúp AI hiểu “không khí” bạn muốn:

  • cozy atmosphere — ấm cúng
  • professional — chuyên nghiệp
  • playful — vui tươi
  • elegant — thanh lịch
  • highly detailed — chi tiết cao
  • clean background — nền sạch

Công thức ghép prompt

Ghép tất cả lại theo công thức:

[Chủ thể], [Phong cách], [Góc chụp], [Ánh sáng], [Màu sắc], [Chi tiết bổ sung]

Ví dụ:

A Vietnamese coffee shop on a rainy street corner in Saigon,
photography style, eye level shot, warm golden hour lighting,
warm earth tones, cozy atmosphere, highly detailed

Prompt cho Midjourney: Tips và mẫu

Midjourney là công cụ tạo hình ảnh AI được yêu thích nhất hiện nay nhờ chất lượng hình ảnh vượt trội. Nó có một số cú pháp đặc thù bạn cần biết.

Cú pháp cơ bản

Midjourney sử dụng lệnh /imagine trong Discord, kèm theo các tham số:

Tham sốÝ nghĩaVí dụ
--arTỷ lệ khung hình--ar 16:9 (ngang), --ar 9:16 (dọc), --ar 1:1 (vuông)
--vPhiên bản model--v 6.1
--style rawÍt can thiệp nghệ thuật, giữ nguyên prompt--style raw
--stylize (hoặc --s)Mức độ “nghệ thuật hoá” (0-1000)--s 250 (mặc định)
--chaosMức độ đa dạng giữa các kết quả (0-100)--chaos 30
--noLoại bỏ yếu tố không muốn--no text, watermark

Tips quan trọng cho Midjourney

  • Dùng tiếng Anh — Midjourney hiểu tiếng Anh tốt hơn nhiều
  • Đặt chủ thể lên đầu — từ khoá đầu tiên có trọng lượng cao nhất
  • Dùng --no để loại bỏ yếu tố không mong muốn (text, watermark, blur…)
  • Thử nhiều --ar — tỷ lệ khung hình ảnh hưởng rất lớn đến bố cục

4 mẫu prompt Midjourney

Ảnh quán cà phê Việt Nam (cho blog du lịch):

/imagine A cozy Vietnamese coffee shop interior, wooden furniture,
drip coffee filter on table, tropical plants, soft morning light
through window, warm earth tones, lifestyle photography --ar 16:9
--v 6.1 --s 200

Banner bán hàng Shopee (ảnh sản phẩm mỹ phẩm):

/imagine Luxury skincare serum bottle on white marble surface,
surrounded by fresh rose petals and green leaves, soft studio
lighting, clean minimalist composition, product photography,
pastel pink and white color scheme --ar 1:1 --v 6.1 --no text

Ảnh đại diện chuyên nghiệp (cho LinkedIn):

/imagine Professional headshot of a young Asian businessman in
navy suit, confident smile, blurred modern office background,
soft natural light, shallow depth of field, corporate photography
--ar 1:1 --v 6.1 --style raw

Minh hoạ concept AI (cho bài blog):

/imagine A human hand reaching toward a glowing digital AI brain,
connected by streams of light data, futuristic minimalist style,
blue and amber color palette, dark background, 3D render,
cinematic lighting --ar 16:9 --v 6.1 --s 300

Prompt cho DALL-E 3: Đặc điểm riêng

DALL-E 3 (tích hợp trong ChatGPT và Bing Image Creator) có đặc điểm khác Midjourney: nó hiểu ngôn ngữ tự nhiên rất tốt. Bạn có thể viết prompt dạng mô tả chi tiết như đang kể cho bạn nghe.

Điểm mạnh của DALL-E 3

  • Hiểu ngữ cảnh tốt — viết dạng câu văn dài, mô tả tự nhiên
  • Xử lý text trong hình — tạo chữ trong ảnh chính xác hơn các tool khác
  • Dùng được tiếng Việt — DALL-E 3 qua ChatGPT hiểu tiếng Việt khá ổn
  • Miễn phí qua Bing Image Creator — không cần trả phí

Tips cho DALL-E 3

  • Viết prompt dài và chi tiết — DALL-E 3 thích mô tả cụ thể
  • Chỉ rõ bạn KHÔNG muốn gì ngay trong prompt (ví dụ: “no text overlay”)
  • Nếu dùng qua ChatGPT, hãy chat qua lại để tinh chỉnh
  • Dùng cụm từ I NEED + mô tả để nhấn mạnh yêu cầu quan trọng

4 mẫu prompt DALL-E 3

Ảnh bìa blog về AI:

Create a modern, clean illustration for a blog header about
artificial intelligence for beginners. Show a friendly robot
helping a person at a desk with a laptop. Use a warm color
palette with amber and cream tones. The style should be flat
illustration, welcoming and non-intimidating. No text in the image.

Ảnh sản phẩm trà sữa (cho quán):

Product photography of a beautiful bubble tea drink in a clear
glass cup. The drink is light brown with dark tapioca pearls
visible at the bottom. Topped with cream and a bamboo straw.
Placed on a light wooden table with soft bokeh background of
a modern Vietnamese tea shop. Warm, inviting lighting. Shot
from a 45-degree angle.

Thumbnail YouTube (về kiếm tiền online):

Create an eye-catching YouTube thumbnail concept. A young
Vietnamese person sitting at a desk with a laptop, looking
excited. Behind them, floating icons of dollar signs, graphs
going up, and a shopping cart. Bright, energetic colors —
yellow, orange, and teal. 3D cartoon style, expressive face.
No text in the image.

Minh hoạ chatbot cho website:

A friendly AI chatbot character floating above a smartphone screen.
The chatbot has a round, warm design with a simple smile face.
Chat bubbles surround it. Modern flat illustration style. Color
scheme: amber (#F59E0B), charcoal (#1C1917), and cream (#FFFBF5)
background. Clean, minimal, professional.

Prompt cho Stable Diffusion: Negative prompt và parameters

Stable Diffusion (SD) khác biệt ở chỗ bạn có thể chạy miễn phí trên máy tính và điều chỉnh rất nhiều thông số kỹ thuật. Đây là công cụ linh hoạt nhất nhưng cũng cần hiểu thêm một chút kỹ thuật.

Positive prompt vs Negative prompt

Đây là điểm khác biệt lớn nhất của Stable Diffusion. Bạn viết hai loại prompt:

  • Positive prompt — những gì bạn MUỐN có trong hình
  • Negative prompt — những gì bạn KHÔNG muốn

Negative prompt phổ biến (copy dùng luôn):

ugly, blurry, low quality, deformed, disfigured, bad anatomy,
bad proportions, extra limbs, watermark, text, signature,
out of frame, cropped, worst quality, low resolution,
duplicate, morbid

Thông số quan trọng

Thông sốÝ nghĩaGiá trị gợi ý
CFG ScaleMức độ AI “tuân thủ” prompt (càng cao càng sát prompt)7-12
StepsSố bước xử lý (càng nhiều càng mịn, nhưng lâu hơn)25-50
SamplerThuật toán tạo hìnhDPM++ 2M Karras
SeedSố ngẫu nhiên (giữ nguyên để tạo hình tương tự)-1 (random)

4 mẫu prompt Stable Diffusion

Ảnh sản phẩm bánh trung thu (cho quảng cáo):

Positive:

Vietnamese mooncake on elegant red lacquer plate, golden crust
with intricate pattern, surrounded by autumn leaves and tea set,
product photography, studio lighting, shallow depth of field,
8k, highly detailed, warm golden tones

Negative:

blurry, low quality, watermark, text, deformed, ugly, cropped

CFG: 9 | Steps: 35 | Sampler: DPM++ 2M Karras

Ảnh phong cảnh Hội An (cho travel blog):

Positive:

Ancient town of Hoi An Vietnam at dusk, yellow lanterns glowing
along the river, traditional boats, reflections in water,
cinematic photography, golden hour lighting, warm vibrant colors,
highly detailed, 8k resolution

Negative:

modern buildings, cars, tourists, blurry, low quality, watermark

CFG: 8 | Steps: 30 | Sampler: DPM++ 2M Karras

Ảnh minh hoạ flat design (cho slide thuyết trình):

Positive:

Flat vector illustration of a person working on laptop with AI
assistant, floating data charts and icons, modern office setting,
clean minimalist style, pastel color palette, geometric shapes,
professional business illustration

Negative:

realistic, 3d, photographic, cluttered, dark, gloomy, text

CFG: 10 | Steps: 30 | Sampler: Euler a

Ảnh chân dung nghệ thuật (cho avatar mạng xã hội):

Positive:

Portrait of a young Asian woman, soft smile, wearing casual
modern outfit, cherry blossom background, soft natural lighting,
shallow depth of field, portrait photography, warm pastel tones,
beautiful detailed eyes, 8k

Negative:

ugly, deformed, bad anatomy, extra limbs, blurry, low quality,
watermark, signature, cropped

CFG: 7 | Steps: 40 | Sampler: DPM++ 2M Karras

20 mẫu prompt hình ảnh dùng ngay

Dưới đây là 20 mẫu prompt được chia theo tình huống sử dụng thực tế. Bạn có thể copy và chỉnh sửa theo nhu cầu. Các prompt này hoạt động tốt trên cả Midjourney và DALL-E 3.

Ảnh sản phẩm (5 prompts)

1. Mỹ phẩm/skincare:

Luxury facial cream jar on soft pink fabric, surrounded by fresh
flower petals and water droplets, soft studio lighting, clean
white background, product photography, pastel tones, elegant
and premium feel

2. Đồ ăn/thức uống:

Vietnamese pho bo in traditional ceramic bowl, steam rising,
fresh herbs and lime on side, chopsticks resting on bowl,
top-down flat lay, natural window light, food photography,
warm inviting colors

3. Thời trang:

Casual linen shirt hanging on wooden hanger against white brick
wall, soft natural light from left side, minimalist style,
neutral earth tones, fashion product photography, clean and airy

4. Đồ handmade/craft:

Handmade ceramic mug with unique glaze pattern, placed on rustic
wooden table, dried flowers in background, soft morning light,
artisan product photography, warm cozy atmosphere, shallow
depth of field

5. Công nghệ/gadget:

Modern wireless earbuds on dark slate surface, dramatic side
lighting creating reflections, minimalist composition, dark
moody aesthetic, tech product photography, sharp focus,
professional studio shot

Ảnh bìa blog và social media (5 prompts)

6. Blog về kinh doanh:

Flat illustration of a small business owner at desk with laptop,
charts growing upward, coffee cup, potted plant, warm amber
and cream color scheme, modern clean design, business concept,
no text

7. Post Instagram về tips:

Clean minimalist background with geometric shapes, soft gradient
from peach to cream, space for text overlay on the right side,
modern abstract design, Instagram story format, vertical
composition

8. Banner Facebook group:

Wide banner illustration showing diverse group of people
collaborating around a table with laptops and AI icons floating
above, friendly cartoon style, warm colors, community vibe,
welcoming atmosphere, 16:9 ratio

9. Thumbnail podcast:

Stylized microphone icon with sound waves radiating outward,
modern gradient background purple to blue, podcast cover art
style, bold and eye-catching, square format, clean design,
no text

10. Cover ebook/guide:

Modern book cover concept, abstract geometric design with
flowing lines and dots, professional minimalist style, dark
navy background with gold accents, elegant typography space
at center, vertical format

Ảnh minh hoạ concept (5 prompts)

11. AI và tương lai:

Futuristic cityscape with AI integration, holographic displays
floating in air, humans and robots coexisting, warm sunset
lighting, optimistic sci-fi style, detailed illustration,
cinematic wide shot

12. Học online/e-learning:

Isometric illustration of online learning platform, student at
desk with floating screens showing video lessons, books, and
certificates, cheerful pastel colors, modern flat design,
educational concept

13. Tự động hoá công việc:

Illustration of a workflow automation concept, conveyor belt
with tasks being processed by friendly robots, papers turning
into digital files, clean flat design, blue and orange color
scheme, modern tech illustration

14. Kết nối mạng xã hội:

Network of connected people represented by friendly avatar icons,
lines connecting them in a web pattern, warm gradient background,
social connection concept, modern flat illustration, diverse
representation

15. Tiết kiệm thời gian:

Split image concept: left side shows stressed person buried in
paperwork (muted gray tones), right side shows relaxed person
with laptop while AI handles tasks (bright warm colors),
before-and-after illustration style

Ảnh chân dung và avatar (5 prompts)

16. Avatar chuyên nghiệp (nam):

Professional portrait of a young Asian man in smart casual
outfit, confident natural smile, modern co-working space
background with bokeh, soft window light, headshot photography,
warm tones, approachable and professional

17. Avatar chuyên nghiệp (nữ):

Professional portrait of a young Asian woman in modern business
attire, warm genuine smile, clean minimal office background,
soft studio lighting with rim light, headshot photography,
natural makeup, confident and friendly expression

18. Avatar hoạt hình (cho Zalo/Facebook):

Cute cartoon avatar of a young person with friendly smile,
wearing headphones and holding a coffee cup, chibi anime style,
soft pastel background, warm colors, digital illustration,
kawaii aesthetic, simple and adorable

19. Avatar cho thương hiệu cá nhân:

Stylized digital portrait of a creative professional, modern
pop art influence, bold colors with amber and teal accents,
geometric background elements, confident pose, contemporary
illustration style, personal brand identity

20. Ảnh nhóm/team (cho About page):

Illustration of a diverse team of 4-5 people working together
in a modern bright office, collaborative atmosphere, each person
showing different skills (laptop, design, phone, whiteboard),
friendly flat illustration style, warm color palette, team
spirit concept

Sai lầm phổ biến khi viết prompt hình ảnh

Sau khi hướng dẫn nhiều học viên trong cộng đồng Bình Dân AI, đây là những sai lầm mình thấy lặp lại nhiều nhất:

Sai lầm 1: Prompt quá ngắn và mơ hồ

Sai: A beautiful house

Đúng: A modern Vietnamese townhouse with rooftop garden, white walls, tropical plants, street level view, golden hour lighting, architectural photography

AI không đọc được suy nghĩ của bạn. Bạn cần mô tả chi tiết những gì mình hình dung.

Sai lầm 2: Nhồi quá nhiều chủ thể

Sai: A girl, a dog, a cat, a bird, a house, a car, a tree, flowers, a river, mountains, clouds, sun

Quá nhiều chủ thể khiến AI bị “loạn”. Hãy tập trung vào 1-2 chủ thể chính và dùng phần còn lại làm bối cảnh.

Sai lầm 3: Không chỉ định phong cách

Nếu không nói rõ phong cách, AI sẽ tự chọn — và thường cho ra kết quả “nửa thực nửa ảo” rất kỳ lạ. Luôn chỉ rõ: photography, illustration, 3D render, v.v.

Sai lầm 4: Quên negative prompt (Stable Diffusion)

Với Stable Diffusion, không dùng negative prompt gần như chắc chắn cho ra hình ảnh bị lỗi — tay thừa ngón, mặt biến dạng, chữ lung tung. Luôn thêm negative prompt cơ bản.

Sai lầm 5: Không iteration

Rất hiếm khi prompt đầu tiên cho ra hình ảnh hoàn hảo. Hãy:

  1. Bắt đầu với prompt cơ bản
  2. Xem kết quả, nhận ra thiếu gì
  3. Thêm/chỉnh chi tiết
  4. Lặp lại cho đến khi ưng ý

Giống như viết prompt cho ChatGPTiteration là chìa khoá.

Sai lầm 6: Dùng tiếng Việt trên Midjourney/SD

Midjourney và Stable Diffusion hiểu tiếng Anh tốt hơn rất nhiều. Nếu bạn không giỏi tiếng Anh, hãy dùng ChatGPT để dịch prompt trước khi đưa vào Midjourney/SD. DALL-E 3 qua ChatGPT thì dùng tiếng Việt được.

Kết luận

Viết prompt tạo hình ảnh AI không khó, nhưng cần luyện tập. Hãy nhớ công thức cơ bản:

Chủ thể + Phong cách + Góc chụp/Ánh sáng + Màu sắc + Chi tiết bổ sung

Mỗi công cụ có đặc điểm riêng:

  • Midjourney — chất lượng nghệ thuật cao, dùng tham số --ar, --v, --no
  • DALL-E 3 — hiểu ngôn ngữ tự nhiên tốt, xử lý text trong hình, có bản miễn phí
  • Stable Diffusion — linh hoạt nhất, chạy miễn phí trên máy, cần negative prompt

Hãy bắt đầu bằng cách copy các mẫu prompt ở trên, chỉnh sửa cho phù hợp nhu cầu của bạn, và thử nghiệm liên tục. Mỗi lần thử là một lần bạn hiểu thêm về cách AI “nhìn” prompt của bạn.

Bước tiếp theo

Nếu bạn muốn được hướng dẫn thêm, chia sẻ prompt, và xem hình ảnh AI mọi người trong cộng đồng tạo ra, hãy tham gia Zalo group “Bình Dân AI” — nơi mọi người cùng học AI mỗi ngày, hoàn toàn miễn phí.

Khám phá thêm

Cần người hướng dẫn trực tiếp?

Coaching 1-1 với chuyên gia — 90 phút tập trung vào vấn đề của bạn + follow-up 2 tuần.

Đặt lịch coaching 1-1 →

Tham gia Bình Dân AI

Hoàn toàn miễn phí. Bạn sẽ nhận được:

Vào group Zalo ngay

Miễn phí mãi mãi. Không spam. Rời group bất cứ lúc nào.