Google vừa ra mắt Whisk, một công cụ AI mới cho phép người dùng tạo hình ảnh bằng cách sử dụng các hình ảnh đầu vào thay vì văn bản. Công nghệ này đánh dấu bước tiến mới trong lĩnh vực AI sáng tạo, khi Google tiếp tục cạnh tranh với các đối thủ lớn như OpenAI trong việc phát triển và phổ biến các sản phẩm AI tiêu dùng.
1. Cách hoạt động của Whisk
Whisk cho phép người dùng tải lên các hình ảnh về chủ thể, bối cảnh và phong cách để tạo ra một hình ảnh tổng hợp. Công cụ này không yêu cầu người dùng nhập văn bản để mô tả ý tưởng, nhưng vẫn cung cấp tùy chọn bổ sung văn bản nếu cần kiểm soát chi tiết hơn.
![Whisk - Công cụ AI mới của Google thay đổi cách sáng tạo hình ảnh 4 google whisk anh 2](https://didongviet.vn/dchannel/wp-content/uploads/2024/12/google-whisk-anh-2.jpg)
Whisk không phải là một trình chỉnh sửa ảnh truyền thống mà là một công cụ sáng tạo, giúp người dùng khám phá ý tưởng nhanh chóng. Google nhấn mạnh rằng sản phẩm này tập trung vào việc tạo cảm hứng và hỗ trợ trong các dự án sáng tạo hơn là tạo ra những tác phẩm hoàn chỉnh và chính xác.
2. Công nghệ đứng sau Whisk
Whisk được xây dựng dựa trên Gemini, nền tảng AI cốt lõi của Google, ra mắt vào tháng 12 năm 2023. Nó cũng kết hợp với Imagen 3, công cụ tạo hình ảnh từ văn bản mới nhất được phát triển bởi DeepMind, phòng thí nghiệm AI của Google.
![Whisk - Công cụ AI mới của Google thay đổi cách sáng tạo hình ảnh 5 google whisk anh 3](https://didongviet.vn/dchannel/wp-content/uploads/2024/12/google-whisk-anh-3.jpg)
Khi người dùng tải lên hình ảnh, Gemini sẽ tạo chú thích cho ảnh và gửi đến Imagen 3 để xử lý. Quá trình này không tái tạo chính xác hình ảnh gốc mà thay vào đó, nó nắm bắt “bản chất” của chủ thể, cho phép người dùng sáng tạo và biến đổi hình ảnh theo cách mới mẻ.
3. Điểm mạnh và hạn chế
Một trong những tính năng nổi bật của Whisk là khả năng “remix” hình ảnh. Người dùng có thể thay đổi các yếu tố đầu vào để tạo ra các phiên bản khác nhau, từ đồ chơi bông, ghim men, đến sticker. Tuy nhiên, kết quả cuối cùng có thể khác biệt so với hình ảnh ban đầu, như thay đổi về chiều cao, kiểu tóc hoặc tông màu da.
![Whisk - Công cụ AI mới của Google thay đổi cách sáng tạo hình ảnh 6 google whisk anh 4](https://didongviet.vn/dchannel/wp-content/uploads/2024/12/google-whisk-anh-4.jpg)
Dù vậy, Google đã học hỏi từ những sai sót trước đó. Khi Gemini ra mắt công cụ tạo hình ảnh từ văn bản vào tháng 2 năm 2024, công ty vấp phải chỉ trích vì các hình ảnh được tạo ra chứa sai sót lịch sử. Với Whisk, Google hy vọng tránh được những lỗi tương tự và cải thiện trải nghiệm người dùng.
4. Whisk trong cuộc đua AI
Whisk không chỉ là một công cụ sáng tạo mà còn là một bước đi chiến lược của Google trong cuộc đua AI với các công ty như OpenAI và Meta. Kể từ khi OpenAI ra mắt DALL-E vào năm 2021, các công cụ tạo hình ảnh AI đã trở thành tâm điểm chú ý và chiếm lĩnh mạng xã hội.
OpenAI gần đây đã ra mắt Sora, một công cụ tạo video từ văn bản, tiếp tục đẩy mạnh cạnh tranh trong lĩnh vực AI sáng tạo. Trong khi đó, Whisk của Google tập trung vào việc mang lại sự linh hoạt và cảm hứng sáng tạo cho người dùng thông qua hình ảnh, tạo nên một hướng đi khác biệt.
5. Tạm kết
Hiện tại, Whisk đang được thử nghiệm trên Google Labs tại Mỹ và vẫn trong giai đoạn phát triển ban đầu. Dù chưa phải là một công cụ hoàn hảo, Whisk mở ra cơ hội lớn cho người dùng trong việc khám phá ý tưởng và sáng tạo nội dung. Whisk vẫn chưa hỗ trợ tại Việt Nam tuy nhiên người dùng có thể đăng ký nhận thông tin tại đây.
Dan Ives, Giám đốc điều hành tại Wedbush Securities, nhận định rằng Whisk là một bước đi quan trọng, thể hiện sức mạnh công nghệ của Google. Đây là một phần trong chiến lược lớn hơn của Google, bao gồm cả việc ra mắt hệ điều hành Android mới được hợp tác phát triển với Samsung và Qualcomm vào năm 2025.
Cảm ơn bạn đã đọc bài viết, chúc bạn có một ngày vui vẻ. Đừng quên đăng ký kênh Dchannel để nhận được thông tin công nghệ mới nhất và chính xác mỗi ngày. Nếu bạn cần mua sản phẩm công nghệ, điện thoại, MacBook, phụ kiện, hãy ghé Di Động Việt để trải nghiệm dịch vụ mua sắm công nghệ hàng đầu.
Nguồn: CNN
Xem thêm:
- Gemini giờ đây có khả năng tóm tắt toàn bộ thư mục trên Google Drive
- Google Gemini 2.0 ra mắt – Kỷ nguyên AI đa phương thức
- Google Gemini – Danh sách tổng hợp các tiện ích mở rộng hữu ích
- Gemini “bắt tay” Spotify – Trải nghiệm âm nhạc thông minh hơn trên Android
Di Động Việt