Google vừa công bố Gemini 2.0, thế hệ mới nhất của mô hình AI với khả năng xuất đầu ra hình ảnh, âm thanh và tích hợp công cụ cho “kỷ nguyên tác nhân AI”. Đây là bước tiến quan trọng, mang lại những cải tiến vượt bậc so với các phiên bản trước và mở ra tiềm năng ứng dụng rộng lớn trong nhiều lĩnh vực.
1. Agentic AI: khi AI tự hành động như một tác nhân độc lập
Gemini 2.0 được thiết kế với các tính năng Agentic AI – một khái niệm mới trong đó các hệ thống AI có thể tự thực hiện các nhiệm vụ một cách độc lập nhờ khả năng ra quyết định thích ứng. Điều này đồng nghĩa với việc AI không chỉ cung cấp thông tin mà còn có thể tự động hóa các công việc như mua sắm hoặc đặt lịch hẹn chỉ từ một lời nhắc của người dùng.
Các tác nhân AI trong Gemini 2.0 được tối ưu hóa cho nhiều lĩnh vực khác nhau. Ví dụ, chúng có thể đưa ra gợi ý chiến thuật trong trò chơi như Clash of Clans, hoặc chọn quà và thêm vào giỏ hàng dựa trên yêu cầu của người dùng. Đây là bước tiến vượt bậc, cho thấy AI đã bắt đầu hành động thay vì chỉ phản hồi một cách thụ động.
2. Project Astra và Project Mariner: những tác nhân AI tiên phong
Một trong những điểm nhấn của Gemini 2.0 là Project Astra – trợ lý AI toàn diện dành riêng cho điện thoại Android. Astra hỗ trợ đa phương thức với khả năng tích hợp sâu vào các công cụ của Google như Search, Lens và Maps, giúp người dùng có trải nghiệm liền mạch hơn.
Bên cạnh đó, Google còn giới thiệu Project Mariner, một tác nhân AI có khả năng tự điều hướng trong trình duyệt web. Mariner hiện đang trong giai đoạn thử nghiệm sớm dưới dạng tiện ích mở rộng cho Chrome, dành cho những người dùng “được chọn”. Tính năng này hứa hẹn sẽ giúp tự động hóa các tác vụ phức tạp trên web, từ nghiên cứu đến giao dịch trực tuyến.
3. Gemini 2.0 Flash: cải tiến vượt bậc về hiệu năng
Song song với các tác nhân AI, Google cũng ra mắt Gemini 2.0 Flash – phiên bản thử nghiệm đầu tiên của mô hình AI mới. Flash được thiết kế để giảm độ trễ, cải thiện hiệu suất và nâng cao khả năng lý luận, đặc biệt trong các lĩnh vực như toán học và lập trình.
Một điểm đáng chú ý là Gemini 2.0 Flash tích hợp mô hình Imagen 3 của Google DeepMind, cho phép tạo hình ảnh trực tiếp từ văn bản. Đây là sự cải tiến lớn, đưa khả năng sáng tạo nội dung của AI lên một tầm cao mới.
Hiện tại, Gemini 2.0 Flash đã có sẵn trên nền tảng web và sẽ sớm xuất hiện trong ứng dụng Gemini trên di động. Các nhà phát triển cũng có thể truy cập mô hình này thông qua Google AI Studio và Vertex AI.
4. Tương lai của Gemini 2.0 và AI đa phương thức
Google xác nhận rằng sẽ có thêm các kích thước mô hình Gemini 2.0 được công bố vào tháng 1 tới đây, hứa hẹn mở rộng phạm vi ứng dụng và khả năng tích hợp của AI. Với khả năng xuất đầu ra đa phương thức và hành động như một tác nhân độc lập, Gemini 2.0 đang định hình lại cách chúng ta tương tác với trí tuệ nhân tạo.
Tuy nhiên, sự phát triển này cũng đặt ra không ít câu hỏi về tương lai của AI. Một số người dùng lo ngại về việc AI có thể thay thế con người trong các nhiệm vụ quan trọng hoặc gây ra những vấn đề về quyền riêng tư. Dù vậy, không thể phủ nhận rằng Gemini 2.0 là một bước tiến lớn, mở ra kỷ nguyên mới cho công nghệ AI.
Cảm ơn bạn đã đọc bài viết, chúc bạn có một ngày vui vẻ. Đừng quên đăng ký kênh Dchannel để nhận được thông tin công nghệ mới nhất và chính xác mỗi ngày. Nếu bạn cần mua sản phẩm công nghệ, điện thoại, MacBook, phụ kiện, hãy ghé Di Động Việt để trải nghiệm dịch vụ mua sắm công nghệ hàng đầu.
Nguồn: GSMArena
Xem thêm:
- Google Gemini – Danh sách tổng hợp các tiện ích mở rộng hữu ích
- Gemini “bắt tay” Spotify – Trải nghiệm âm nhạc thông minh hơn trên Android
- Gemini chính thức “đổ bộ” lên iOS – Cuộc chiến AI tiếp tục nóng lên
- Gemini ra mắt Utilities Extension dành cho điện thoại Android
Di Động Việt