SỞ KHOA HỌC VÀ CÔNG NGHỆ THÀNH PHỐ CẦN THƠ

Đột phá phát triển khoa học, công nghệ, đổi mới sáng tạo và chuyển đổi số quốc gia

Chế độ AI của Google sẽ thúc đẩy thực tế tăng cường (AR) nhanh hơn

[13/05/2025 10:16]

Khi trí tuệ nhân tạo (AI) và thực tế tăng cường (AR) tiếp tục hội tụ, chúng ta đang chứng kiến một làn sóng công nghệ mới mở ra cách con người tương tác với thế giới. Từ AR sáng tạo trong các quy trình thiết kế cho đến vai trò ngày càng "thông minh" của AI trong kính thông minh như Ray-Ban Meta, sự kết hợp này đang thay đổi cách máy móc “nhìn thấy” và “hiểu được” môi trường xung quanh chúng ta – rồi chuyển hóa nó thành thông tin hữu ích, bằng giọng nói hay hình ảnh.

Mới đây, Google đã tiến thêm một bước với tính năng mới mang tên Chế độ AI (AI Mode) – một phần trong chiến lược dài hạn của hãng nhằm kết hợp tìm kiếm bằng hình ảnh và trợ lý ảo thông minh.

Camera không chỉ chụp – mà còn hiểu được thế giới

Với tầm nhìn của mình, Google đang biến camera điện thoại – hoặc kính thông minh trong tương lai – thành “con mắt AI”. Nhờ vào sự kết hợp giữa thị giác máy tính và nhận dạng đối tượng, thiết bị có thể xác định những gì nó đang thấy: từ tòa nhà, cuốn sách, đến một chiếc áo khoác bất kỳ trên đường phố.

Và Google là công ty ở vị trí lý tưởng để hiện thực hóa điều này: sau 25 năm là “bộ não tìm kiếm” của internet, họ sở hữu kho dữ liệu khổng lồ – một "tập huấn luyện AI" hoàn hảo. Chẳng hạn, Google Hình ảnh giúp đào tạo Google Lens nhận diện vật thể. Street View thì cung cấp dữ liệu không gian để định vị trong điều kiện AR – như khi bạn đang dùng bản đồ 3D dẫn đường hoặc tìm thông tin về một cửa hàng trên phố.

Chế độ AI – Trợ lý thông minh của thời đại đa phương tiện

Trong khi các công ty đang chạy đua AI, Google đang định nghĩa lại cách chúng ta tìm kiếm và tương tác, với chế độ AI không chỉ phản hồi câu hỏi một cách tự nhiên mà còn ghi nhớ chuỗi hội thoại, cho phép bạn tiếp tục hỏi nhiều lần mà không cần bắt đầu lại từ đầu.

Điểm nổi bật gần đây là sự kết hợp giữa Chế độ AI và tìm kiếm đa phương tiện – tức là bạn có thể bắt đầu bằng hình ảnh, rồi tinh chỉnh bằng văn bản, thậm chí tiếp tục hỏi thêm nhiều câu truy vấn. Ví dụ: bạn chụp một chiếc áo khoác ai đó đang mặc, dùng Lens để tìm sản phẩm, rồi hỏi thêm: “Có màu đỏ không?”, hoặc “Phiên bản dành cho nữ?”. AI sẽ tiếp tục xử lý và lọc kết quả.

Từ chiếc giá sách đến cửa hàng gần bạn – tất cả đều trở thành dữ liệu hiểu được

Google gọi cơ chế này là “query fan-out” – kỹ thuật lan rộng truy vấn từ một hình ảnh hoặc vật thể cụ thể ra những dữ liệu liên quan, nhờ biểu đồ tri thức và hàng năm kinh nghiệm xử lý hình ảnh.

Ví dụ: bạn chụp một giá sách và hỏi, “Nếu tôi thích những cuốn này, có sách nào tương tự được đánh giá cao không?” Sau đó bạn tiếp tục, “Tôi chỉ có thời gian đọc nhanh – có cuốn nào phù hợp không?”. Không còn là các truy vấn rời rạc như trước đây – mà là một chuỗi hội thoại mạch lạc, nơi AI hiểu và phản hồi thông minh.

Tương lai của AR có thể được định hình bởi AI

Mặc dù nhiều ví dụ kể trên (áo khoác, sách…) nghiêng về mua sắm và thương mại, nhưng ý nghĩa lớn hơn nằm ở chỗ: AI Mode đang làm tăng đáng kể khả năng “hiểu ngữ cảnh thị giác” – một yếu tố sống còn trong các ứng dụng AR.

Khi thiết bị có thể xác định vị trí, nhận dạng vật thể, hiểu người dùng đang muốn gì – thì AR không còn là lớp hình ảnh ảo trên thế giới thật, mà là một lớp trí tuệ số hóa, phản hồi theo thời gian thực.

Và với tốc độ phát triển AI hiện nay, tương lai này sẽ đến không sớm thì muộn – nhưng chắc chắn không xa.

ARinsider (tdkhiem)
Bản quyền @ 2017 thuộc về Sở Khoa học và Công nghệ thành phố Cần Thơ
Địa chỉ: Số 02, Lý Thường kiệt, phường Tân An, quận Ninh Kiều, thành phố Cần Thơ
Điện thoại: 0292.3820674, Fax: 0292.3821471; Email: sokhcn@cantho.gov.vn
Trưởng Ban biên tập: Ông Trần Đông Phương An - Phó Giám đốc Sở Khoa học và Công nghệ thành phố Cần Thơ