Google giới thiệu VideoPoET – mở ra hướng mới trong tạo video nhất quán

Ngày đăng:

Sau khi trợ lý AI Copilot của Microsoft có khả năng tạo các đoạn âm thanh từ văn bản, Google đã giới thiệu VideoPoET – một mô hình ngôn ngữ lớn (LLM) đẩy ranh giới trong tạo video với các đoạn 10 giây có ít hiện tượng nhiễu hơn. Mô hình hỗ trợ nhiều tác vụ tạo video, bao gồm chuyển đổi văn bản sang video, biến đổi hình ảnh sang video, tùy biến phong cách video, làm đầy video và chức năng chuyển đổi video sang âm thanh.

1. VideoPoET có khả năng tạo ra các clip 10 giây từ văn bản và hoạt ảnh từ hình ảnh tĩnh

Không giống các tiền nhiệm, VideoPoet tách biệt bằng cách xuất sắc trong việc tạo video chuyển động lớn nhất quán. Mô hình thể hiện sức mạnh bằng cách tạo ra các video dài 10 giây, vượt xa các đối thủ cạnh tranh bao gồm Gen-2. Đáng chú ý, VideoPoet không dựa trên dữ liệu cụ thể để tạo video, phân biệt nó với các mô hình khác đòi hỏi đầu vào chi tiết để có kết quả tối ưu.

780x520 sample with logo DDV 47 2

Khả năng đa dạng này là nhờ sử dụng mô hình đa phương tiện lớn, đặt nó trên hành trình tiềm năng trở thành xu hướng chính trong tạo video.

2. Cách hoạt động của VideoPoET

VideoPoet của Google đi theo hướng khác so với xu hướng thịnh hành trong các mô hình tạo video, chủ yếu dựa trên các phương pháp khuếch tán. Thay vào đó, VideoPoet tận dụng sức mạnh của các mô hình ngôn ngữ lớn (LLM). Mô hình tích hợp mượt mà các tác vụ tạo video trong một LLM, loại bỏ nhu cầu đào tạo riêng các thành phần cho mỗi chức năng.

780x520 sample with logo DDV 48 1

Kết quả là các video với độ dài và hành động, phong cách đa dạng dựa trên nội dung văn bản đầu vào. Ngoài ra, VideoPoet có thể chuyển đổi hình ảnh đầu vào thành hoạt hình dựa trên các lời nhắc được cung cấp, thể hiện khả năng thích ứng với các loại đầu vào khác nhau.

3. Tạm kết

Vậy bạn nghĩ sao về công nghệ VideoPoet mới của Google? Liệu nó có tiềm năng trở thành xu hướng mới trong lĩnh vực tạo video AI? Hãy để lại ý kiến của bạn bên dưới!

Cảm ơn bạn đã đọc bài viết, chúc bạn một ngày tốt lành. Đừng quên theo dõi kênh Dchannel để được cập nhật thông tin công nghệ mới nhất và chính xác nhất mỗi ngày. Khi cần mua sản phẩm công nghệ, điện thoại, MacBook, phụ kiện… bạn hãy đến với Di Động Việt để được tiếp cận dịch vụ mua sắm công nghệ tốt nhất.

Nguồn: Gizmochina


Xem thêm:


Di Động Việt

Đánh giá bài viết
Anh Tuấn
Anh Tuấn
Phạm Anh Tuấn hiện là Chuyên Gia Mảng Công Nghệ tại Dchannel thuộc hệ thống Di Động Việt với hơn một thập kỷ kinh nghiệm trong lĩnh vực công nghệ di động. Tuấn không ngừng theo dõi và cập nhật những chuyển động mới nhất của ngành, anh luôn mang đến cho độc giả những thông tin nhanh chóng, chính xác và có chiều sâu. Niềm đam mê công nghệ là kim chỉ nam trong công việc của Tuấn. Anh không chỉ đơn thuần cung cấp tin tức, mà còn chia sẻ những kiến thức chuyên môn và góc nhìn riêng về các xu hướng công nghệ mới. Mục tiêu lớn nhất của Anh Tuấn là giúp độc giả tiếp cận công nghệ một cách gần gũi, dễ hiểu và thực tiễn nhất. Anh tin rằng công nghệ không phải là thứ gì đó xa vời, mà là công cụ hữu ích có thể cải thiện chất lượng cuộc sống của mỗi người.

BÀI VIẾT LIÊN QUAN

BÌNH LUẬN

Vui lòng nhập bình luận của bạn
Vui lòng nhập tên của bạn ở đây