Google ra mắt Veo 3 tạo video AI có âm thanh đồng bộ

Google đã giới thiệu Veo 3, một mô hình tổng hợp video AI mới có khả năng tạo ra đoạn video độ nét cao kèm âm thanh đồng bộ. Trước đây, các video AI thường chỉ có hình ảnh mà không có âm thanh hoặc chỉ rất ngắn. Veo 3 có thể tạo ra đoạn video dài tám giây với giọng nói, hội thoại và hiệu ứng âm thanh, điều chưa từng có ở các mô hình trước đây. Khi thử nghiệm với cảnh Will Smith ăn mì spaghetti, Veo 3 tạo ra âm thanh nhai mì nhưng có âm thanh lạ như bị giòn khi nhai, do dữ liệu huấn luyện có nhiều ví dụ về miệng nhai với hiệu ứng tiếng giòn. Mô hình này phản ánh cách AI học dựa trên dữ liệu huấn luyện và có thể tạo ra các kết quả bất ngờ khi dữ liệu không cân đối. Veo 3 đánh dấu bước tiến quan trọng trong việc kết hợp âm thanh đồng bộ với video AI, mở ra nhiều tiềm năng ứng dụng trong tương lai.

Download Subtitle (.srt)

Xem bài gốc