Google Gemini tích hợp Veo 2 cho người dùng trả phí

Google đang mở rộng khả năng sáng tạo của ứng dụng Gemini AI với công cụ tạo video Veo 2 – đây là nâng cấp khá “chất chơi” trong cuộc đua AI hình ảnh. Với khả năng dựng video 8 giây ở độ phân giải 720p chỉ trong vòng 1-2 phút, Veo 2 hứa hẹn định nghĩa lại cách chúng ta tương tác với nội dung hình ảnh trong tương lai.

1. Veo 2 là gì và tại sao nó đáng được chú ý?

Veo 2 là mô hình tạo video bằng trí tuệ nhân tạo thế hệ mới của Google, được tích hợp trực tiếp vào ứng dụng Gemini dành cho người dùng gói Advanced. Từng được công bố vào cuối năm 2024, Veo 2 nổi bật với khả năng tạo chuyển động nhân vật mượt mà, tái hiện khung cảnh chân thực và kiểm soát chi tiết hình ảnh tốt hơn đáng kể so với các phiên bản trước. Google mô tả đây là mô hình có thể tạo ra “tính điện ảnh” nhờ khả năng hiểu vật lý thế giới thực và chuyển động con người.

Đáng chú ý, Veo 2 không chỉ tạo video từ văn bản mô tả mà còn có thể kết hợp hình ảnh (qua công cụ Whisk) để tạo hoạt cảnh. Điều này mở ra tiềm năng lớn cho các nhà sáng tạo nội dung, marketer, nhà làm phim độc lập và cả người dùng phổ thông muốn kể chuyện bằng hình ảnh động.

2. Cách hoạt động của Veo 2 trên Gemini Advanced

Để bắt đầu, người dùng cần chọn mô hình “Veo 2” từ trình đơn trong ứng dụng Gemini – có thể sử dụng trên cả web và thiết bị di động. Sau đó, chỉ cần nhập mô tả chi tiết về cảnh quay mong muốn. Từ đó, AI sẽ tạo ra một đoạn video ngắn dài 8 giây, định dạng MP4, tỷ lệ 16:9 và độ phân giải 720p. Video có thể được tải về hoặc chia sẻ qua liên kết g.co/gemini/share.

Quá trình xử lý chỉ mất khoảng 1-2 phút, cho phép người dùng nhanh chóng thử nghiệm nhiều ý tưởng khác nhau. Càng mô tả chi tiết, kết quả càng sát với mong đợi – một nguyên lý quen thuộc trong thế giới AI sáng tạo hiện nay. Dù thời lượng video còn hạn chế, nhưng sự liền mạch trong chuyển động và mức độ chi tiết hình ảnh là điều tạo nên khác biệt.

3. Một số ví dụ minh họa từ chính Google

Google đưa ra một số ví dụ thú vị để minh họa khả năng của Veo 2. Chẳng hạn: “chú chó con chạy băng qua khu vườn phủ đầy tuyết trong nắng sớm”; “mèo con lần đầu ra biển, giật mình khi sóng ập tới”; hoặc “cảnh quay từ trên cao dốc đá xanh bên bãi biển Thái Bình Dương trong ánh sáng hoàng hôn”.

gemini veo 2 2 — Ảnh chụp từ video do Gemini Veo 2 tjo

Những video này không chỉ mô phỏng chính xác chuyển động và ánh sáng mà còn sở hữu cảm giác điện ảnh rõ rệt – điều thường thấy trong các đoạn phim ngắn chuyên nghiệp. Với người dùng phổ thông, đây là cơ hội để hiện thực hóa trí tưởng tượng một cách sống động và tức thì.

4. Vấn đề quyền riêng tư và kiểm soát nội dung

Mỗi khung hình do Veo 2 tạo ra đều được gắn watermark kỹ thuật số bằng công nghệ SynthID. Đây là biện pháp của Google nhằm đảm bảo tính minh bạch và chống lạm dụng nội dung AI. Người xem hoặc nền tảng phân phối có thể dễ dàng nhận diện đâu là video do AI tạo ra.

Bên cạnh đó, Google cũng áp dụng giới hạn số lượng video có thể tạo mỗi tháng đối với người dùng Gemini Advanced (gói $19.99/tháng). Khi gần đạt giới hạn, người dùng sẽ nhận được thông báo. Điều này giúp kiểm soát tài nguyên và tránh việc hệ thống bị quá tải bởi khối lượng yêu cầu quá lớn.

5. Whisk và khả năng chuyển ảnh tĩnh thành động

Không chỉ dừng lại ở văn bản, người dùng Google One AI Premium giờ đây cũng có thể sử dụng Veo 2 trong ứng dụng thử nghiệm Whisk để “Animate” hình ảnh. Tính năng này cho phép chuyển đổi ảnh tĩnh thành video động kéo dài 8 giây – một cách tiếp cận hoàn toàn mới trong việc tái sử dụng nội dung hình ảnh.

Khả năng “prompt bằng hình ảnh” thay vì văn bản mở ra không gian sáng tạo mới, nơi người dùng có thể tạo hoạt cảnh từ chính những bức ảnh tự chụp, tranh minh họa, hoặc thiết kế đồ họa. Đây là bước tiến quan trọng đưa AI hình ảnh gần hơn với công cụ sản xuất nội dung chuyên nghiệp.

6. Triển vọng và giới hạn của video AI hiện tại

Dù ấn tượng, Veo 2 vẫn có những giới hạn nhất định. Thời lượng video chỉ dừng lại ở 8 giây, độ phân giải 720p chưa đạt chuẩn 4K cho các mục đích thương mại. Ngoài ra, khả năng kiểm soát diễn biến chi tiết trong video vẫn phụ thuộc vào mức độ mô tả – điều đòi hỏi người dùng phải làm quen với cách “nói chuyện” với AI.

Tuy vậy, đây vẫn là cột mốc quan trọng – không chỉ cho Google, mà còn cho toàn ngành công nghệ AI sáng tạo. Veo 2 cho thấy việc sản xuất video không còn là đặc quyền của các studio lớn. Bất kỳ ai có ý tưởng đều có thể chuyển nó thành hình ảnh động trong vòng vài phút.

7. Kết luận

Veo 2 là một nâng cấp đầy hứa hẹn trong lĩnh vực video AI từ Google, đưa khả năng tạo nội dung hình ảnh động đến gần hơn với đại chúng. Dù còn giới hạn về mặt kỹ thuật, nhưng tiềm năng sáng tạo mà công cụ này mang lại là không thể phủ nhận. Với việc tích hợp vào Gemini và Whisk, Google đang cho thấy tham vọng định hình lại cách chúng ta sản xuất và tiêu thụ video trong kỷ nguyên AI.

Nguồn: 9to5Google

Xem thêm:

Di Động Việt