Field Log

กระบวนการสร้างภาพสามมิติอัตโนมัติ

เจาะลึกโครงสร้างระบบประมวลผลภาพอวกาศ 3 มิติ ที่ออกแบบมาเพื่อทำงานแบบ Batch Processing โดยเน้นความแม่นยำของมิติและการจัดการทรัพยากรเครื่องอย่างมีประสิทธิภาพ

4 MIN READ
07/04/2026
กระบวนการสร้างภาพสามมิติอัตโนมัติ

Automated 3D Space Visualization Pipeline

สถานะ: Production Ready (Verified by Code)

บทความนี้เจาะลึกโครงสร้างระบบประมวลผลภาพอวกาศ 3 มิติ ที่ออกแบบมาเพื่อทำงานแบบ Batch Processing โดยเน้นความแม่นยำของมิติและการจัดการทรัพยากรเครื่องอย่างมีประสิทธิภาพ

System Data Flow (Technical Pipeline)

ระบบถูกออกแบบมาให้เป็นลำดับขั้น (Linear Pipeline) เพื่อลดความซับซ้อนและง่ายต่อการ Debug:

graph TD A[Raw Image] --> B[Pad to 4:3] B --> C[AI Depth Inference] C --> D[Depth Enhancement] D --> E[Anaglyph Rendering] E --> F[Post-Process Sharpening]

1. Pre-processing: Pad to 4:3

Logic: เนื่องจากหน้าจอท้องฟ้าจำลองหรือจอ TV ส่วนใหญ่มีสัดส่วนที่คงที่ ระบบจะทำการคำนวณ target_ratio = 4/3 และสร้าง Canvas สีดำขึ้นมาขนาบข้าง เพื่อป้องกันภาพยืด (Distortion) และรักษา Composition ดั้งเดิมของภาพอวกาศไว้

2. Inference: MiDaS Depth Engine

Implementation:

  • ใช้โมเดล MiDaS_small เพื่อความรวดเร็ว (High-speed inference)
  • มีระบบเช็คฮาร์ดแวร์อัตโนมัติ torch.device("cuda" if torch.cuda.is_available() else "cpu") เพื่อดึงพลังจาก GPU มาใช้ให้ได้มากที่สุด

3. Depth Map Optimization (The Secret Sauce)

เพื่อให้ภาพ "ลอย" แบบมีคุณภาพ โค้ดมีการทำ Post-processing บน Depth Map 3 ชั้น:

  1. Bilateral Filter: ลดสัญญาณรบกวน (Noise) แต่ยังรักษา "ขอบดาว" ให้คมชัด
  2. CLAHE: เร่ง Contrast ของความลึกในส่วนที่มืด (Nebula ส่วนใหญ่จะมืด) ทำให้เห็นมิติในเงามืดได้ชัดเจนขึ้น
  3. Gamma Correction (1.8): ปรับความสว่างของ Depth Map เพื่อชดเชยความมืดที่เกิดจากฟิลเตอร์แว่น 3 มิติ

3D Rendering Architecture (Dubois Matrix)

ส่วนที่สำคัญที่สุดคือการสร้างภาพเหลื่อมสี (Anaglyph) ซึ่งใช้เทคนิค Dubois Optimized Matrix แทนการแยกสี Red/Cyan แบบทั่วไป:

  • Pixel Shifting: ใช้หลักการคำนวณ shift_map = (depth - convergence) * strength
    • Strength (15–30): ควบคุม "ความโดดเด่น" (Pop-out effect)
    • Convergence (0.2–0.5): ควบคุม "จุดโฟกัส" (ยิ่งต่ำ วัตถุยิ่งพุ่งออกจากจอ)
  • Color Projection: ใช้ Matrix ชุดพิเศษ (0.4154, 0.4710, 0.1677 ฯลฯ) เพื่อให้ภาพที่ได้มีสีสันที่ถูกต้องที่สุดเมื่อมองผ่านแว่น ลดปัญหาอาการ "สีเพี้ยน" หรือ "ภาพมืด"

Operations & Troubleshooting Logic

ในฐานะผู้ดูแลระบบ (Operator) นี่คือตัวแปรที่สามารถ Tune หน้างานได้ทันที:

Parameterสถานการณ์ที่ต้องปรับวิธีแก้
Strengthภาพดูแบน ไม่ค่อยมีมิติเพิ่มค่า (22 → 30)
Convergenceคนดูบอกว่าปวดตา หรือภาพแยกจากกันเกินไปเพิ่มค่า (0.35 → 0.45) เพื่อดันภาพกลับเข้าจอ
Gammaรายละเอียดในเนบิวลามืดเกินไปปรับเพิ่ม (1.8 → 2.0) ในส่วน get_depth_map
Pad to 4:3ภาพแสดงผลไม่เต็มจอ หรือมีขอบเหลือตรวจสอบ canvas logic ในโค้ด

Scalability & Deployment

ระบบนี้ถูกเขียนด้วย Object-Oriented Thinking ทำให้สามารถต่อยอดได้ง่าย:

  1. Batch Processing: วนลูปประมวลผลทั้งโฟลเดอร์โดยอัตโนมัติ พร้อมรองรับไฟล์หลายนามสกุล (.jpg, .webp, .png)
  2. Modular Logic: แยกส่วน add_text_layer ออกมา เพื่อให้สามารถเปลี่ยนข้อความหรือโลโก้ตามงานนิทรรศการต่างๆ ได้โดยไม่ต้องแก้ Logic หลัก

สรุป: สถาปัตยกรรมนี้คือการผสมผสานระหว่าง AI Computer Vision และ Classic Image Processing เพื่อสร้างเครื่องมือที่ใช้งานได้จริงในพื้นที่สาธารณะ (Field-Ready System)

Share this log to social network