Sau khi trợ lý AI Copilot của Microsoft có khả năng tạo các đoạn âm thanh từ văn bản, Google đã giới thiệu VideoPoET – một mô hình ngôn ngữ lớn (LLM) đẩy ranh giới trong tạo video với các đoạn 10 giây có ít hiện tượng nhiễu hơn. Mô hình hỗ trợ nhiều tác vụ tạo video, bao gồm chuyển đổi văn bản sang video, biến đổi hình ảnh sang video, tùy biến phong cách video, làm đầy video và chức năng chuyển đổi video sang âm thanh.
1. VideoPoET có khả năng tạo ra các clip 10 giây từ văn bản và hoạt ảnh từ hình ảnh tĩnh
Không giống các tiền nhiệm, VideoPoet tách biệt bằng cách xuất sắc trong việc tạo video chuyển động lớn nhất quán. Mô hình thể hiện sức mạnh bằng cách tạo ra các video dài 10 giây, vượt xa các đối thủ cạnh tranh bao gồm Gen-2. Đáng chú ý, VideoPoet không dựa trên dữ liệu cụ thể để tạo video, phân biệt nó với các mô hình khác đòi hỏi đầu vào chi tiết để có kết quả tối ưu.
Khả năng đa dạng này là nhờ sử dụng mô hình đa phương tiện lớn, đặt nó trên hành trình tiềm năng trở thành xu hướng chính trong tạo video.
2. Cách hoạt động của VideoPoET
VideoPoet của Google đi theo hướng khác so với xu hướng thịnh hành trong các mô hình tạo video, chủ yếu dựa trên các phương pháp khuếch tán. Thay vào đó, VideoPoet tận dụng sức mạnh của các mô hình ngôn ngữ lớn (LLM). Mô hình tích hợp mượt mà các tác vụ tạo video trong một LLM, loại bỏ nhu cầu đào tạo riêng các thành phần cho mỗi chức năng.
Kết quả là các video với độ dài và hành động, phong cách đa dạng dựa trên nội dung văn bản đầu vào. Ngoài ra, VideoPoet có thể chuyển đổi hình ảnh đầu vào thành hoạt hình dựa trên các lời nhắc được cung cấp, thể hiện khả năng thích ứng với các loại đầu vào khác nhau.
3. Tạm kết
Vậy bạn nghĩ sao về công nghệ VideoPoet mới của Google? Liệu nó có tiềm năng trở thành xu hướng mới trong lĩnh vực tạo video AI? Hãy để lại ý kiến của bạn bên dưới!
Cảm ơn bạn đã đọc bài viết, chúc bạn một ngày tốt lành. Đừng quên theo dõi kênh Dchannel để được cập nhật thông tin công nghệ mới nhất và chính xác nhất mỗi ngày. Khi cần mua sản phẩm công nghệ, điện thoại, MacBook, phụ kiện… bạn hãy đến với Di Động Việt để được tiếp cận dịch vụ mua sắm công nghệ tốt nhất.
Nguồn: Gizmochina
Xem thêm:
- Google sẽ mang trí tuệ nhân tạo Gemini đến với điện thoại Samsung
- Google ra mắt Gemini – mô hình AI mới được kỳ vọng vượt trội hơn ChatGPT
- Pixel 9 có thể đi kèm trợ lý AI độc quyền “Pixie” của Google
Di Động Việt