SỞ KHOA HỌC VÀ CÔNG NGHỆ THÀNH PHỐ CẦN THƠ

Khoa học, công nghệ và Đổi mới sáng tạo - Khơi dậy khát vọng kiến tạo tương lai

Công cụ AI mới của Microsoft tạo video sống động từ ảnh chân dung

[25/04/2024 17:01]

Microsoft đã phát triển một công cụ AI mới mang tên VASA-1, chỉ cần cũng cấp ảnh chân dung, nó sẽ tạo video để khuôn mặt trong bức ảnh đó có thể nói chuyện và hát với biểu cảm tự nhiên, thể hiện thần thái của nhân vật thông qua các chuyển động tự nhiên của khuôn mặt và đầu, tạo ra một trải nghiệm chân thực và sống động hơn.

Theo Microsoft, VASA-1 được xây dựng dựa trên một "hệ thống động học cho khuôn mặt" được huấn luyện thông qua một mô hình tạo chuyển động tốt hơn một cách toàn diện so với các phương pháp trước đó. AI này hỗ trợ xử lý ảnh chân dung với phần đầu và phần trên của thân, thể hiện nhiều biểu cảm khác nhau như vui vẻ, tức giận, ngạc nhiên hoặc nghiêm nghị.

Trong video giới thiệu trên YouTube, Microsoft đã thể hiện khả năng của VASA-1 bằng cách làm cho các bức ảnh tạo bởi Dall-E 3 và StyleGAN2 nói chuyện tự nhiên. Người dùng cũng có khả năng điều chỉnh thông số khuôn mặt, biểu cảm, giọng nói và nhiều chi tiết khác, tạo ra những trải nghiệm tương tác độc đáo. PetaPixel, một trang chuyên về hình ảnh, đã đánh giá VASA-1 cho khả năng thể hiện tốt hơn so với các AI tương tự, khiến khó nhận biết nếu xem lần đầu.

Tuy nhiên, Microsoft hiện vẫn từ chối tiết lộ thông tin về mô hình phía sau công nghệ này và không có kế hoạch phát hành sản phẩm riêng hoặc cung cấp cho nhà phát triển. Họ giới thiệu VASA-1 nhằm phô diễn một trong những khả năng của AI trong việc phát triển cảm xúc trực quan cho ảnh đại diện, nhấn mạnh vào ứng dụng tích cực của công nghệ này. Tuy nhiên, họ cũng cảnh báo về nguy cơ sử dụng sai mục đích của AI, đặc biệt là trong việc mạo danh con người.

Ngoài làn sóng chatbot như ChatGPT hay Google Gemini, lĩnh vực AI cũng chứng kiến cuộc đua giữa các mô hình có khả năng tạo video như thật từ ảnh tĩnh. Trước đó, Alibaba giới thiệu công cụ tương tự là EMO (Emotive Portrait Alive). AI này có thể tạo nét mặt, tư thế, di chuyển phần lông mày, nhíu mắt hay thậm chí lắc lư theo điệu nhạc.

https://www.vista.gov.vn/ (tnxmai)
Bản quyền @ 2017 thuộc về Sở Khoa học và Công nghệ thành phố Cần Thơ
Địa chỉ: Số 02, Lý Thường kiệt, phường Tân An, quận Ninh Kiều, thành phố Cần Thơ
Điện thoại: 0292.3820674, Fax: 0292.3821471; Email: sokhcn@cantho.gov.vn
Trưởng Ban biên tập: Ông Trần Đông Phương An - Phó Giám đốc Sở Khoa học và Công nghệ thành phố Cần Thơ