AI Mode đã bắt đầu thử nghiệm cách đây một tháng và hiện Google đang mở rộng quyền truy cập cho người dùng Labs miễn phí, đồng thời bổ sung tính năng tìm kiếm hình ảnh Lens. Đây là một bước tiến quan trọng trong việc đưa trí tuệ nhân tạo đa phương thức của Google đến với nhiều người dùng hơn, cho phép họ tìm kiếm và khám phá thông tin thông qua hình ảnh và văn bản.
1. Mở rộng quyền truy cập và tích hợp Google Lens
Lúc ra mắt, AI Mode chỉ có sẵn cho người đăng ký Google One AI Premium. Như chúng tôi đã phát hiện trước đó, Google xác nhận hôm nay rằng nó đang đến với “hàng triệu người dùng Labs nhiều hơn ở Hoa Kỳ” mà không phải trả tiền. Đây là một động thái đáng chú ý để mở rộng phạm vi tiếp cận của công nghệ AI tiên tiến này đến nhiều người dùng hơn, không chỉ giới hạn trong nhóm người đăng ký trả phí.

Đồng thời, AI Mode đang thêm đầu vào và hiểu đa phương thức cho phép bạn chụp ảnh mới với Google Lens hoặc tải lên một hình ảnh có sẵn. Điều này cho phép bạn “dễ dàng đặt câu hỏi phức tạp về những gì bạn thấy.” Trong ảnh mẫu được cung cấp, AI Mode “nhận dạng chính xác từng cuốn sách trên kệ và đưa ra các truy vấn để tìm hiểu về các cuốn sách và các đề xuất tương tự được đánh giá cao.” Kết quả cuối cùng là “danh sách các cuốn sách được đề xuất với các liên kết để tìm hiểu thêm và mua hàng,” trong khi bạn có thể đặt câu hỏi tiếp theo.
2. Cách thức vận hành của công nghệ đằng sau
Đằng sau hậu trường, Google đang tận dụng khả năng đa phương thức của Gemini để “hiểu toàn bộ cảnh trong một hình ảnh, bao gồm cả ngữ cảnh về cách các đối tượng liên quan đến nhau và các vật liệu, màu sắc, hình dạng và sắp xếp độc đáo của chúng”. Đây là một bước tiến đáng kể so với các công nghệ nhận dạng hình ảnh trước đây, vốn thường chỉ nhận diện các đối tượng riêng lẻ mà không hiểu mối quan hệ giữa chúng.

Google giải thích chi tiết hơn về quy trình: “Lens nhận dạng chính xác từng đối tượng trong hình ảnh. Sử dụng kỹ thuật query fan-out của chúng tôi, AI Mode sau đó đưa ra nhiều truy vấn về hình ảnh nói chung và các đối tượng trong hình ảnh, truy cập nhiều thông tin hơn cả về chiều rộng và chiều sâu so với tìm kiếm truyền thống trên Google. Kết quả là một phản hồi cực kỳ tinh tế và phù hợp với ngữ cảnh, giúp bạn thực hiện bước tiếp theo.” Kỹ thuật “query fan-out” này là một phương pháp tiếp cận mới để mở rộng phạm vi tìm kiếm và tổng hợp thông tin từ nhiều nguồn khác nhau, mang lại kết quả toàn diện hơn.
3. Trải nghiệm người dùng và mẫu sử dụng ban đầu
Google Lens trong AI Mode có sẵn trên Android và iOS, bắt đầu triển khai từ hôm nay. Để truy cập tính năng này, người dùng có thể đi đến trang chủ của AI Mode để tìm biểu tượng Lens mới trong trường tìm kiếm ở dưới cùng. Thao tác này sẽ đưa bạn đến giao diện người dùng Google Lens thông thường. Khi người dùng nhấn giữ vào nút chụp, họ có thể nói truy vấn của mình, kết hợp cả đầu vào giọng nói và hình ảnh.
Google hôm nay cũng chia sẻ một số mẫu sử dụng sau một tháng thử nghiệm công khai. Người dùng cho biết họ thích “thiết kế sạch sẽ, thời gian phản hồi nhanh và khả năng hiểu các câu hỏi phức tạp và tinh tế.” Các truy vấn AI Mode được cho là “dài gấp đôi so với các truy vấn tìm kiếm truyền thống trên Google” (trung bình). Người dùng đang sử dụng nó cho các câu hỏi khám phá, mở rộng, và “các tác vụ phức tạp hơn – như so sánh hai sản phẩm, khám phá hướng dẫn và lập kế hoạch cho chuyến đi.”
4. Kết luận
Việc Google mở rộng AI Mode cho người dùng Labs miễn phí và thêm tính năng tìm kiếm đa phương thức Google Lens đánh dấu một bước tiến quan trọng trong chiến lược AI của công ty. Bằng cách kết hợp khả năng xử lý ngôn ngữ tự nhiên mạnh mẽ của Gemini với công nghệ nhận dạng hình ảnh tiên tiến, Google đang tạo ra một trải nghiệm tìm kiếm toàn diện hơn có thể hiểu và phản hồi các truy vấn phức tạp dựa trên cả văn bản và hình ảnh.
Dữ liệu sử dụng ban đầu cho thấy người dùng đang tận dụng các khả năng nâng cao này cho các tác vụ phức tạp hơn nhiều so với tìm kiếm truyền thống, với các truy vấn dài gấp đôi so với bình thường. Điều này phản ánh cách mà AI đa phương thức có thể biến đổi cách chúng ta tương tác với công nghệ tìm kiếm, cho phép đối thoại tự nhiên hơn và hiểu biết toàn diện hơn về thế giới xung quanh chúng ta.
Với việc triển khai đang diễn ra trên cả nền tảng Android và iOS, Google đang đưa những công nghệ AI tiên tiến này đến với nhiều người dùng hơn, đẩy nhanh việc áp dụng và phát triển những khả năng mới cho tương lai của tìm kiếm và trải nghiệm thông tin.
Theo 9to5Google
Xem thêm:
- Google đã phát triển ứng dụng dash cam cho Android Automotive, không phải Android Auto
- Microsoft đưa Copilot Search lên hàng đầu trong Bing để cạnh tranh với Google
- Google mở rộng carousel “your space” cho Discover trên nhiều thiết bị Android
- Ứng Dụng Gemini Hoạt Động Với Google Photos Ra Sao?
Di Động Việt