Mô hình AI vượt trội trong việc loại bỏ phản chiếu trên ảnh đơn
Việc ghi lại một cảnh đẹp thông qua các vật liệu phản chiếu, chẳng hạn như kính, thường dẫn đến sự chồng ảnh ngoài ý muốn - hiển thị cả cảnh được truyền qua và cảnh phản chiếu không mong muốn. Mặc dù các kỹ thuật loại bỏ phản chiếu truyền thống đã có những tiến bộ, nhưng chúng thường gặp khó khăn với các mẫu phản chiếu phức tạp và điều kiện ánh sáng khác nhau, để lại các hiện tượng nhiễu ảnh làm giảm chất lượng hình ảnh.
Những tiến bộ gần đây trong trí tuệ nhân tạo đang cung cấp những giải pháp mới mạnh mẽ. Dưới sự dẫn dắt của Giáo sư Jae-Young Sim từ Trường Cao học Trí tuệ Nhân tạo tại UNIST, các nhà nghiên cứu đã phát triển một mô hình AI tiên tiến có khả năng tách biệt hiệu quả các phản xạ khỏi cảnh được truyền tải, cho phép thu được hình ảnh rõ nét và chân thực hơn phía sau bề mặt phản chiếu. Bài báo của họ đã được công bố trên tạp chí IEEE Transactions on Image Processing .

Hiệu suất của SIRS trên các hình ảnh thực tế đầy thách thức với các hiện tượng phản xạ mạnh và không rõ ràng về mặt không gian. Các hình ảnh truyền được tái tạo bằng phương pháp đề xuất được so sánh với hai phương pháp tiên tiến nhất là DSRNet [20] và DSIT [21]. Nguồn: IEEE Transactions on Image Processing (2026). DOI: 10.1109/tip.2026.3659334
Nhận thấy những hạn chế của các phương pháp hiện có, thường gặp khó khăn trong các tình huống phản xạ phức tạp và không đồng nhất về không gian, nhóm nghiên cứu đã thiết kế một phương pháp phân đoạn thông minh hình ảnh chồng lớp để phân tích mục tiêu. Việc phân đoạn này cho phép loại bỏ chính xác các phản xạ trong khi vẫn duy trì tính toàn vẹn của cảnh được truyền tải.
Cốt lõi của bước đột phá này nằm ở hai kỹ thuật: Sự kết hợp bổ sung giữa các chuyên gia (Complementary Mixture-of-Experts - CoME) và Sự chú ý chéo bổ sung (Complementary Cross-Attention - CoCA).
CoME sử dụng kiến trúc hỗn hợp các chuyên gia (MoE) để tự động phân bổ các mạng nơ-ron chuyên biệt - được gọi là "chuyên gia" - cho các vùng khác nhau trong ảnh dựa trên đặc điểm phản xạ cục bộ. Các chuyên gia này cùng nhau phân tích cả lớp truyền qua và lớp phản xạ, trao đổi thông tin liên quan để cải thiện độ chính xác phân tách, đặc biệt là ở các vùng có mô hình phản xạ đa dạng.
CoCA cải thiện quá trình tái tạo bằng cách xem xét cả các vùng có tương quan mạnh và tương quan yếu. Không giống như các cơ chế chú ý truyền thống chỉ tập trung vào các vùng có liên quan cao, CoCA nhận ra rằng các chi tiết phản chiếu có ý nghĩa cũng có thể tồn tại trong các vùng ít tương quan hơn, cho phép phân tách toàn diện và hiệu quả hơn.
Các đánh giá sâu rộng trên nhiều bộ dữ liệu thực tế khác nhau cho thấy phương pháp này vượt trội hơn các phương pháp tiên tiến hiện có cả về chất lượng hình ảnh và hiệu suất định lượng. Nó vẫn hoạt động ổn định ngay cả trong các tình huống khó khăn với sự biến dạng phản xạ phức tạp - những lĩnh vực mà các mô hình trước đây thường hoạt động kém hiệu quả.
Giáo sư Sim nhận xét: "Hình ảnh phản chiếu trong các cảnh tự nhiên vốn dĩ rất phức tạp và đa dạng. Các mạng nơ-ron truyền thống thường gặp khó khăn trong việc xử lý sự đa dạng này. Phương pháp của chúng tôi, với cơ chế phân bổ chuyên gia thích ứng và cơ chế chú ý kép, cung cấp một giải pháp linh hoạt và hiệu quả hơn. Chúng tôi tin rằng công nghệ này có tiềm năng đáng kể trong nhiều ứng dụng xử lý hình ảnh, từ nhiếp ảnh đến các hệ thống tự động."
https://techxplore.com/news/2026-03-ai-excels-image.html#google_vignette (ctngoc)