JSON Prompt là gì?

JSON Prompt đang được sử dụng ngày càng nhiều, đặc biệt khi dùng AI tạo ảnh, tạo video với Veo 3, ChatGPT, Claude… Vậy JSON prompt là gì và có ưu thế gì so với cách viết prompt truyền thống?

JSON Prompt là gì?

Thực chất, JSON prompt vẫn chỉ là nội dung văn bản người dùng đưa vào, nhưng được viết theo cấu trúc JSON (dạng key-value) để mô tả chi tiết các yếu tố của video.

JSON, hay JavaScript Object Notation, là định dạng trao đổi dữ liệu gọn nhẹ. JSON sử dụng các cặp khóa-giá trị (key-value) được đặt trong dấu ngoặc nhọn {} để tổ chức dữ liệu theo cách dễ đọc cho con người và dễ phân tích cho máy. Ví dụ, một đối tượng JSON đơn giản có thể trông như thế này:

JSON Prompt là gì?
Cấu trúc JSON cơ bản

Cấu trúc này đảm bảo dữ liệu luôn nhất quán và dễ tiếp cận, khiến nó trở thành lựa chọn ưa thích trong phát triển web, API và giờ đây là kỹ thuật nhắc lệnh. Không giống như văn bản tự do, JSON loại bỏ sự mơ hồ bằng cách định nghĩa rõ ràng từng phần tử.

Nếu trước đây bạn viết prompt: “Tạo hình ảnh phòng khách hiện đại, ánh sáng tự nhiên, phong cách Hàn Quốc.” AI có thể khó hiểu đúng ý của bạn thì với JSON Prompt, bạn chia nhỏ prompt thành từng yêu cầu cụ thể, rõ ràng. Chẳng hạn với prompt trên, bạn viết lại theo cấu trúc JSON prompt:

{
"task": "tạo hình ảnh nội thất",
"room": "phòng khách",
"style": "Hàn Quốc hiện đại",
"light": "ánh sáng tự nhiên buổi sáng",
"materials": "gỗ sồi, vải lanh trắng",
"camera_angle": "góc nhìn từ cửa bước vào",
"render_style": "siêu thực"
}

Kết quả: AI trả về hình ảnh rất đúng ý, bố cục rõ ràng, chất liệu đúng style bạn mô tả.

Xem thêm 10 Cách viết prompt ChatGPT hiệu quả!

JSON prompt để làm gì?

  • Giúp AI hoặc API phân tích được từng thành phần riêng (ví dụ: bối cảnh, nhân vật, phong cách).
  • Tránh mơ hồ so với viết văn tự do.
  • Dễ xử lý bằng lập trình (ví dụ khi gửi đến API).

Tại sao JSON prompt lại hiệu quả?

Các mô hình ngôn ngữ lớn (LLM) không “hiểu” ngôn ngữ như con người. Chúng nhận diện các quy luật và cấu trúc.

Và JSON thì siêu-cấu-trúc, nó cực kì rõ ràng, không gây hiểu lầm. Chatbot không cần phải “đoán” ý bạn. Bạn đang chỉ thẳng cho nó chính xác thứ bạn muốn.

Bạn có thể so sánh hai ví dụ sau đây để hiểu rõ hơn:

Prompt thông thường: "can you write a tweet about dopamine detox?"

Prompt kiểu JSON:

{
"task": "write a tweet",
"topic": "dopamine detox",
"style": "viral",
"length": "under 280 characters"
}

Kết quả trả về cũng vô cùng khác biệt, JSON prompt có kết quả tốt hơn hẳn.

JSON Prompt là gì?

Cách viết JSON prompt dễ hiểu

Về cơ bản, thay vì mô tả yêu cầu bằng văn bản thông thường thì bạn sử dụng văn bản có cấu trúc như sau để ra lệnh cho các AI.

{
"task": "bạn muốn AI làm gì",
"topic": "chủ đề bạn muốn",
"audience": "đối tượng người đọc, người xem",
"style": "phong cách thể hiện",
"length": "độ dài mong muốn",
"output_format": "định dạng đầu ra mong muốn",
}

Hãy luôn nhớ, sử dụng các cặp Key-Value (Khóa – Giá trị) để cụ thể hóa prompt của bạn. Mỗi “khóa” là một yêu cầu cụ thể (ví dụ: “task”), và “giá trị” là chỉ thị của bạn (ví dụ: “generate a list”).

  • Bước 1: Xác định nhiệm vụ. Bắt đầu bằng cách xác định hành động chính. Sử dụng một khóa rõ ràng như "task" để chỉ định những gì mô hình nên làm—ví dụ: “viết,” “tóm tắt,” hoặc “tạo.” Điều này đặt nền tảng cho lời nhắc.
  • Bước 2: Thêm các tham số chính. Kết hợp các chi tiết thiết yếu bằng cách sử dụng các cặp khóa-giá trị. Các tham số phổ biến bao gồm:
    • "topic": Chủ đề.
    • "audience": Đối tượng người đọc dự định.
    • "length": Số lượng từ hoặc giới hạn ký tự.
    • "tone": Phong cách, chẳng hạn như “chính thức” hoặc “thân mật.”

Ví dụ:

{
  "task": "write a blog post",
  "topic": "JSON prompting",
  "audience": "developers",
  "length": "2000 words",
  "tone": "technical"
}
  • Bước 3: Cấu trúc với các đối tượng lồng nhau. Đối với các tác vụ phức tạp, hãy lồng các đối tượng bổ sung để chia nhỏ các hướng dẫn. Kỹ thuật này, được trình bày trong chuỗi X, hỗ trợ các quy trình nhiều bước:
{
  "task": "create a thread",
  "platform": "twitter",
  "structure": {
    "hook": "curiosity-driven, 20 words",
    "body": "3 insights, 50 words each",
    "cta": "question, 15 words"
  },
  "topic": "AI efficiency"
}
  • Bước 4: Chỉ định định dạng đầu ra. Xác định định dạng đầu ra mong muốn bằng cách sử dụng một khóa như "output_format". Các tùy chọn bao gồm “markdown,” “json,” hoặc “plain text.”
  • Bước 5: Kiểm thử và lặp lại. Chạy lời nhắc thông qua mô hình bạn đã chọn (ví dụ: ChatGPT, Gemini) và tinh chỉnh dựa trên kết quả. Điều chỉnh các tham số để điều chỉnh độ chính xác, tận dụng tính chất tĩnh của JSON sau khi được tối ưu hóa.

Mẫu JSON prompt tạo video

JSON Prompt là gì?

Chẳng hạn, với Veo 3 bạn có thể mô tả cảnh như sau:

{
"task": "tạo video kiến trúc",
"location": "biệt thự phong cách Địa Trung Hải",
"time": "chiều tà",
"movement": "camera bay vòng từ trên xuống, xoay quanh ban công",
"elements": "mái ngói đỏ, tường sơn trắng, cửa vòm",
"mood": "thanh bình, lãng mạn"
}

Hoặc tạo video như sau:

{
  "shot": {
    "composition": "Medium tracking shot, 50mm lens",
    "camera_motion": "Smooth Steadicam walk-along",
    "frame_rate": "24fps",
    "film_grain": "Clean digital with film-emulated LUT"
  },
  "subject": {
    "description": "A young woman with a petite frame and soft porcelain complexion",
    "wardrobe": "Crocheted ivory halter top, high-waisted denim shorts"
  },
  "scene": {
    "location": "A quiet urban street bathed in early morning sunlight",
    "time_of_day": "Early morning",
    "environment": "Empty sidewalks, golden sunlight reflecting off puddles"
  }
}

Ưu điểm của JSON prompt

Việc định dạng prompt dưới dạng JSON mang lại nhiều ưu thế về độ chính xác và kiểm soát so với prompt mô tả tự nhiên thông thường. Cụ thể:

  • Rõ ràng và chi tiết hơn: JSON prompt cung cấp cấu trúc rõ ràng (Clarity) cho ý tưởng của bạn. Bạn muốn thay đổi hoặc thêm bớt các yêu cầu chỉ việc thay đổi các giá trị (value) hoặc thêm một cặp khóa-giá trị (key-value) là xong.
  • Dễ dàng tái sử dụng: Một mẫu JSON bạn có thể lưu lại, tùy chỉnh theo từng dự án.
  • Cố định nhân vật dễ dàng: Khi tạo ảnh hoặc video bạn có thể đặt tên (sử dụng id hoặc name) cho từng nhân vật khác nhau để AI ghi nhớ và tái sử dụng trong các câu lệnh tiếp theo.

Ví dụ một mẫu JSON prompt cố định nhân vật để dùng cho AI tạo ảnh/video (có thể áp dụng với Stable Diffusion, ComfyUI, Runway, Pika…). Bạn chỉ cần thay phần “scene” mỗi lần, nhân vật sẽ giữ nguyên vì toàn bộ đặc điểm nhận dạng + seed vẫn cố định.

{
  "character": {
    "name": "Mai",
    "description": "Vietnamese young woman, petite frame, soft porcelain complexion, almond-shaped brown eyes, natural straight black hair reaching mid-back, oval face with soft jawline, gentle smile",
    "wardrobe": "Light beige linen blouse with puff sleeves, high-waisted denim skirt, brown leather sandals",
    "accessories": "Simple gold stud earrings, thin leather strap watch",
    "style_keywords": "realistic, cinematic, highly detailed, natural lighting"
  },
  "shot": {
    "composition": "Medium shot, eye-level angle, 50mm lens",
    "camera_motion": "Static or slow pan",
    "frame_rate": "24fps",
    "film_grain": "Clean digital with subtle film LUT",
    "seed": 12345678
  },
  "scene": {
    "location": "Quiet cafe corner with large window and soft morning light",
    "time_of_day": "Morning",
    "environment": "Warm wooden furniture, potted plants, light breeze moving the curtain"
  },
  "mood": "Calm, intimate, and nostalgic"
}