Theo dõi nội dung phim ảnh chỉ nhờ nhận diện khuôn mặt
Với mong muốn đóng góp cho cộng đồng thêm một lựa chọn về dịch vụ trực tuyến về phát hiện và nhận biết mặt người, giải quyết bài toán quản lý ảnh và video cũng như rút gọn thời gian xem phim, video trong đời sống hiện đại mà vẫn nắm bắt nội dung chính.
Nhóm sinh viên Nguyễn Thành An, Nguyễn Phát Tài – sinh viên khoa Công nghệ thông tin, Trường đại học khoa học tự nhiên (ĐH quốc gia TP.HCM) - dưới sự hướng dẫn của PGS. TS. Trần Minh Triết, ThS. Nguyễn Vinh Tiệp đã thực hiện đề tài “Tổng hợp và tìm kiếm trên video dựa trên phát hiện và nhận biết mặt người".
Hiện nay, việc xem tivi, phim ảnh và các video tin tức là một hình thức giải trí phổ biến trên toàn cầu. Thế nhưng vẫn còn tồn đọng một số khó khăn cho người xem trong việc theo dõi, nắm bắt nhanh thông tin của video mà họ quan tâm trong điều kiện làm việc công nghiệp hạn hẹp về thời gian. Để giải quyết vấn đề đó, nhóm đã nghiên cứu bài toán phát hiện và nhận diện mặt người – một mảng lớn trong lĩnh vực thị giác máy tính – để mang đến trải nghiệm mới, một hình thức tương tác thông minh cho khán giả qua những chức năng: khái quát nội dung video theo tỷ lệ xuất hiện của các nhân vật quan trọng dựa trên nhận diện khuôn mặt; phân tích và tóm tắt các đoạn theo sự xuất hiện của diễn viên. Từ đó, cho phép người xem truy cập nhanh đến những cảnh mà họ quan tâm và sau cùng là khả năng truy vấn các đoạn, các video liên quan đến từng nhân vật mà khán giả muốn tìm kiếm dựa trên việc nhận diện khuôn mặt.
Hệ thống ứng dụng này được đề xuất dựa trên khả năng phát hiện khuôn mặt trong các frame ảnh của video, đồng thời định danh chính xác một số lượng lớn các nhân vật, diễn viên, chính khách … nổi tiếng. Nhóm đã nghiên cứu những công trình khoa học được công bố gần đây về bài toán phát hiện và nhận diện khuôn mặt để ứng dụng và tinh chỉnh cho phù hợp với mục tiêu và chức năng đề ra.
Đại diện nhóm tác giả, bạn Nguyễn Thành An tóm tắt nguyên lý hoạt động của hệ thống như sau: dựa trên mạng nơ-rơn tích chập, với một tấm ảnh đưa vào, nó sẽ tìm được vị trí tọa độ khuôn mặt và xác định được danh tính khuôn mặt người này. Hiện tại, hệ thống được triển khai như một dịch vụ trực tuyến để cho nhiều loại ứng dụng, thiết bị như máy tính, điện thoại, mạch adruino ... đều có thể sử dụng.
Điểm đặc biệt của hệ thống đó là mục tiêu hướng tới phục vụ người Việt Nam với những đặc trưng về cấu trúc khuôn mặt của mọi người. Bên cạnh việc nghiên cứu và xây dựng hệ thống xem video thông minh này, nhóm còn mở rộng các chức năng phát hiện và nhận diện thành API dạng web để mở rộng khả năng ứng dụng về sau.
Đề tài có tiềm năng ứng dụng và kinh tế về dịch vụ trực tuyến nên tại cuộc thi Sinh viên nghiên cứu khoa học - Euréka 2017 đã được hội đồng giám khảo đánh giá với tính ứng dụng và thực tế cao. Hiện tại, đề tài đang được tiếp tục phát triển tại Phòng thí nghiệm công nghệ phần mềm Đại học khoa học tự nhiên, ĐH quốc gia TP.HCM
Được biết, hướng nghiên cứu tiếp theo của nhóm tác giả là tiếp tục hoàn thiện các chức năng, bổ sung xác định và định danh khuôn mặt, phát triển dịch vụ trực tuyến với giao diện web cho người dùng.
Đề tài đã xuất sắc đạt giải nhất giải thưởng Sinh viên nghiên cứu khoa học - Euréka 2017 do Thành Đoàn TP.HCM tổ chức.