NVIDIA vừa giới thiệu Fugatto, một mô hình AI sáng tạo trong lĩnh vực âm thanh, với khả năng tạo và chỉnh sửa âm thanh từ văn bản. Sản phẩm này không chỉ mở ra những tiềm năng ứng dụng mới mà còn cho thấy sự tiên phong của NVIDIA trong lĩnh vực AI.
1. Fugatto – công cụ đa năng trong thế giới âm thanh
Fugatto được NVIDIA mô tả là “dao đa năng” dành cho âm thanh. Mô hình AI này có thể biến các đoạn văn bản thành âm thanh, từ nhạc nền, giọng nói đến âm thanh tự nhiên như tiếng mưa hoặc chim hót. Không chỉ vậy, Fugatto còn có khả năng chỉnh sửa các tệp âm thanh hiện có, giúp người dùng dễ dàng tùy chỉnh và thử nghiệm các phong cách âm thanh khác nhau.
Điểm nổi bật của Fugatto là khả năng tạo ra các âm thanh thay đổi theo thời gian, như tiếng mưa lớn dần khi cơn bão đến gần. Đây là một bước tiến lớn trong việc mô phỏng âm thanh tự nhiên và cảm xúc con người.
2. Hỗ trợ đa ngôn ngữ và đa giọng điệu
Fugatto được phát triển bởi một nhóm nghiên cứu quốc tế, giúp nó có khả năng hỗ trợ đa ngôn ngữ và đa giọng điệu. NVIDIA nhấn mạnh rằng mô hình này có thể tạo ra giọng nói với nhiều cảm xúc, từ giận dữ, vui vẻ đến trầm buồn, và kết hợp với các yếu tố khác, như giọng địa phương hay bối cảnh môi trường.
Ví dụ, Fugatto có thể tạo giọng nói mang cảm xúc giận dữ bằng một giọng Pháp đặc trưng, hoặc tái hiện tiếng chim hót trong rừng kết hợp với âm thanh của cơn mưa.
3. Ứng dụng trong đời sống và công nghệ
Fugatto mang lại tiềm năng lớn cho nhiều lĩnh vực. NVIDIA cho biết các nhà sản xuất âm nhạc có thể dùng mô hình này để nhanh chóng tạo ra bản mẫu cho một ý tưởng bài hát. Các nhà thiết kế trò chơi điện tử có thể sử dụng Fugatto để tạo âm thanh phù hợp với các thay đổi trong trò chơi, như tiếng bước chân trên nền tuyết hoặc tiếng rừng rậm sống động hơn.
Ngoài ra, Fugatto còn hữu ích trong giáo dục, đặc biệt là các công cụ học ngôn ngữ. Người dùng có thể tạo nội dung âm thanh bằng giọng nói và ngữ điệu cụ thể, giúp học viên dễ dàng tiếp cận và thực hành.
4. Khả năng tự học và vượt giới hạn đào tạo
Một điểm đặc biệt của Fugatto là khả năng tự học và thực hiện các tác vụ ngoài phạm vi đào tạo ban đầu. Với một số tinh chỉnh nhỏ, mô hình này có thể kết hợp các lệnh riêng biệt để tạo ra những âm thanh phức tạp hơn so với khả năng gốc của nó.
Ví dụ, Fugatto có thể kết hợp giọng nói với cảm xúc và hiệu ứng môi trường để tạo ra trải nghiệm âm thanh độc đáo. Điều này mở ra nhiều cơ hội cho các nhà sáng tạo nội dung và công nghệ.
Tuy nhiên, NVIDIA chưa công bố liệu mô hình này có được phát hành công khai hay không. Điều này có thể khiến Fugatto trở thành công cụ độc quyền dành cho các đối tác và khách hàng chiến lược của công ty.
Cảm ơn bạn đã đọc bài viết, chúc bạn có một ngày vui vẻ. Đừng quên đăng ký kênh Dchannel để nhận được thông tin công nghệ mới nhất và chính xác mỗi ngày. Nếu bạn cần mua sản phẩm công nghệ, điện thoại, MacBook, phụ kiện, hãy ghé Di Động Việt để trải nghiệm dịch vụ mua sắm công nghệ hàng đầu.
Nguồn: Engadget
Xem thêm:
- Chủ tịch TSMC: Nvidia sắp trở thành công ty bán dẫn lớn nhất thế giới
- Siêu máy tính AI DGX GH200 của NVIDIA vừa được công bố
- Tin đồn: NVIDIA sẽ mua lại AMD với giá 200 tỷ đô?
- NVIDIA RTX 4090, 4080 sẽ hỗ trợ stream video định dạng AV1 trên Edge và Chrome
Di Động Việt