Google vừa chính thức giới thiệu Gemma 3, thế hệ mới nhất trong dòng mô hình AI mã nguồn mở Gemma của hãng. Sau thành công của Gemma 1 (ra mắt tháng 2/2024) và Gemma 2 (tháng 5/2024), phiên bản thứ ba này được Google mô tả là “mô hình AI tốt nhất thế giới có thể chạy trên một bộ tăng tốc đơn” (single-accelerator model).
1. Hiệu suất vượt trội với công nghệ từ Gemini 2.0
Gemma 3 đánh dấu một bước tiến quan trọng trong dòng mô hình AI mã nguồn mở của Google, được xây dựng từ cùng công nghệ nền tảng đã tạo nên Gemini 2.0. Mô hình mới có 4 kích thước khác nhau gồm 1B, 4B, 12B và 27B tham số, phù hợp với nhiều trường hợp sử dụng và nguồn lực tính toán khác nhau. Theo công bố từ Google, Gemma 3 vượt trội hơn các đối thủ cạnh tranh như Llama-405B, DeepSeek-V3 và o3-mini trong bảng xếp hạng LMArena – một thước đo quan trọng về hiệu suất của các mô hình ngôn ngữ lớn.

Khả năng xử lý ngữ cảnh của Gemma 3 cũng được cải thiện đáng kể với cửa sổ ngữ cảnh (context window) lên đến 128.000 token, cho phép mô hình hiểu và phản hồi với các đoạn văn bản dài. Điều này mở ra nhiều khả năng ứng dụng trong các tác vụ phức tạp đòi hỏi hiểu ngữ cảnh rộng như phân tích tài liệu dài, nghiên cứu học thuật hay viết mã phức tạp. Bên cạnh đó, Gemma 3 còn hỗ trợ hơn 35 ngôn ngữ ngay từ đầu và được huấn luyện trước với hơn 140 ngôn ngữ, phản ánh nỗ lực của Google trong việc tạo ra các mô hình AI đa dạng về ngôn ngữ và toàn cầu hóa.
2. Khả năng đa phương tiện và tính năng nâng cao
Một trong những cải tiến nổi bật của Gemma 3 là khả năng xử lý đa phương tiện. Các phiên bản từ 4B trở lên được trang bị “khả năng suy luận văn bản và hình ảnh nâng cao”, cho phép phân tích hình ảnh, văn bản và video ngắn. Tính năng này mở rộng đáng kể phạm vi ứng dụng của Gemma, từ các ứng dụng hỗ trợ người dùng nhận diện nội dung hình ảnh đến các hệ thống tự động hóa phức tạp yêu cầu xử lý nhiều loại dữ liệu khác nhau.

Google cũng tích hợp khả năng gọi hàm (function calling) và xuất dữ liệu có cấu trúc trong Gemma 3, giúp các nhà phát triển dễ dàng tự động hóa tác vụ và xây dựng trải nghiệm agent AI. Tính năng này đặc biệt hữu ích cho việc tích hợp AI vào các quy trình làm việc hiện có, tự động hóa các tác vụ lặp đi lặp lại và xây dựng các ứng dụng thông minh có khả năng tương tác với các hệ thống và API khác. Ngoài ra, Gemma 3 còn giới thiệu các phiên bản lượng tử hóa (quantized) chính thức, giúp giảm kích thước mô hình và yêu cầu tính toán trong khi vẫn duy trì độ chính xác cao, đáp ứng nhu cầu triển khai trên các thiết bị có tài nguyên hạn chế.
3. Tập trung vào an toàn và quản trị dữ liệu
An toàn luôn là một trong những ưu tiên hàng đầu trong phát triển AI, và Gemma 3 không ngoại lệ. Google đã tích hợp ShieldGemma 2 – một bộ kiểm tra an toàn hình ảnh 4B mạnh mẽ, cung cấp giải pháp sẵn sàng cho an toàn hình ảnh với khả năng xác định ba loại nội dung không an toàn: nội dung nguy hiểm, nội dung khiêu dâm và bạo lực. Đây là công cụ quan trọng giúp các nhà phát triển xây dựng các ứng dụng AI có trách nhiệm và an toàn cho người dùng.

Trong quá trình phát triển, Google cũng nhấn mạnh vào “quản trị dữ liệu mở rộng, điều chỉnh phù hợp với các chính sách an toàn thông qua tinh chỉnh và đánh giá chuẩn mạnh mẽ”. Đặc biệt, với hiệu suất STEM được cải thiện của Gemma 3, Google đã tiến hành các đánh giá cụ thể tập trung vào khả năng sử dụng sai mục đích để tạo ra các chất có hại; kết quả cho thấy mức độ rủi ro thấp. Những nỗ lực này phản ánh cam kết của Google trong việc phát triển AI có trách nhiệm và đạo đức, đồng thời giải quyết các mối quan ngại về an toàn mà các mô hình AI mạnh mẽ có thể gây ra.
4. Kết luận
Với hơn 100 triệu lượt tải xuống trong năm qua và 60.000 biến thể Gemma trong cái được gọi là “Gemmaverse”, dòng mô hình mã nguồn mở của Google đang ngày càng khẳng định vị thế của mình trong cộng đồng AI. Gemma 3 tiếp tục củng cố cam kết của Google đối với AI mở, cung cấp cho các nhà phát triển công cụ mạnh mẽ để xây dựng các ứng dụng AI đa dạng, từ các thiết bị cầm tay đến máy trạm.
Cảm ơn bạn đã đọc bài viết, chúc bạn có một ngày vui vẻ. Đừng quên đăng ký kênh Dchannel để nhận được thông tin công nghệ mới nhất và chính xác mỗi ngày. Nếu bạn cần mua sản phẩm công nghệ, điện thoại, MacBook, phụ kiện, hãy ghé Di Động Việt để trải nghiệm dịch vụ mua sắm công nghệ hàng đầu.
Nguồn: 9to5google
Xem thêm:
- Google Gemini mở tính năng tải và phân tích tài liệu miễn phí
- Gemini Extensions giờ đây có thể kích hoạt ngay từ màn hình khóa
- Google Gemini AI chính thức có mặt trên Android Auto
- Gemini giờ đây có khả năng tóm tắt toàn bộ thư mục trên Google Drive
Di Động Việt