'Cơn sốt' tạo video AI bằng Google Veo 3

Với khả năng tạo hình ảnh chân thực và nhanh chóng, Google Veo 3 gây sốt với hàng loạt video được đăng trên mạng xã hội.

1 Con Sot Tao Video Ai Bang Google Veo 3

"Veo 3 đang giúp tôi tạo những đoạn phim mà trước đây có nằm mơ cũng không nghĩ tới được", Hoàng Bảo, nhà sáng tạo nội dung tại TP HCM theo xu hướng "giấu mặt" - tức mọi hình ảnh, âm thanh... đều tạo bằng AI, bản thân không xuất hiện trên video, chia sẻ.

2 Con Sot Tao Video Ai Bang Google Veo 3  'Cơn sốt' tạo video AI bằng Google Veo 3

Anh Bảo cho biết sau khi Google công bố Veo 3 ở Google I/O 2025 cuối tháng 5, anh đã nhanh chóng dùng công cụ này để thực hiện nhiều video ngắn bằng câu lệnh, ghép lại thành một đoạn phim hoàn chỉnh theo kịch.

Veo là công cụ AI cho phép tạo video từ câu lệnh (prompt). Phiên bản Veo 3 cập nhật khả năng kết hợp âm thanh vào đoạn phim, gồm cả lời thoại giữa các nhân vật hay âm thanh động vật. Theo CNBC, đây là điểm khác biệt quan trọng so với đối thủ, khi hầu hết mô hình hiện nay cho ra video không có âm thanh, hoặc chỉ trên nền nhạc.

Người dùng có thể sử dụng Veo 3 độc lập hoặc qua ứng dụng làm phim AI Flow. Công cụ sử dụng AI tạo ảnh từ văn bản Imagen và Gemini để tạo clip dài 8 giây với đầu vào là lời nhắc, ảnh hoặc video. Flow cũng đi kèm bộ công cụ xây dựng cảnh, cho phép người dùng ghép các đoạn phim, tinh chỉnh thành đoạn nội dung và liền mạch.

"So với các AI tạo video mà tôi đã sử dụng, Veo 3 tốt hơn hẳn ở khả năng tạo hình ảnh, âm thanh, đặc biệt khẩu hình miệng tiếng Việt gần như khớp hoàn toàn với nhân vật - điều các công cụ trước đó chưa có, hoặc làm chưa tốt", anh Bảo chia sẻ. "Điểm trừ là khả năng hiển thị chữ tiếng Việt chưa tốt".

Bảo Quyên, nhân viên marketing tại một hệ thống kinh doanh thiết bị di động ở TP HCM, cũng đang sử dụng Veo 3 để quảng bá sản phẩm mới. "Công cụ dễ sử dụng, tương thích và hiểu nội dung tiếng Việt tốt nên việc tạo video khá nhanh. Dù mọi người đều biết đó là AI, các bài đăng nhận tương tác lớn hơn so với nội dung ảnh trước đây", chị Quyên chia sẻ.

Hoàng Sơn, quản trị viên một nhóm về AI hơn 100.000 thành viên trên Facebook, đánh giá Veo 3 thu hút nhờ khả năng tạo video tự nhiên và hỗ trợ nhiều thứ tiếng, trong đó có tiếng Việt. "Thực tế Veo 3 chưa hỗ trợ thị trường Việt Nam, chủ yếu dành cho người đăng ký ở Mỹ. Do đó, người dùng sẽ phải 'lách' bằng cách sử dụng VPN, điều không phải ai cũng biết, cũng như tốc độ chậm. Việc tạo prompt bằng tiếng Việt thường lỗi hơn so với tiếng Anh, đòi hỏi người tạo cần giỏi tiếng Anh", anh Sơn giải thích. "Ngoài ra, công cụ này không miễn phí mà có giá khá cao".

Trên website của Google, người muốn sử dụng Veo 3 cần đăng ký gói Google AI Ultra với giá 249,99 USD (6,5 triệu đồng) mỗi tháng, giảm giá 50% cho 3 tháng đầu tiên còn 124,99 USD (3,25 triệu đồng). Người dùng sẽ được cung cấp 12.500 token, chi phí tạo một video dài 8 giây khoảng 100 token.

Không chỉ tại Việt Nam, Veo 3 cũng được người dùng toàn cầu đón nhận, tạo nên "cơn sốt". Trên X, YouTube, Instagram và Reddit, nhiều người chia sẻ video với tâm trạng phấn khích, sửng sốt. Một số video nhận hàng trăm nghìn tới hàng triệu lượt xem.

"Nói thẳng, chúng tôi chưa từng thấy thứ gì giống Veo 3 trước đây. Thật ấn tượng. Thật đáng sợ. Và nó sẽ ngày càng tốt hơn nữa ở những phiên bản tiếp theo", trang Mashable bình luận.

Theo trang này, Veo 3 có nhiều ưu điểm vượt trội so với các mô hình khác, chẳng hạn Sora của OpenAI. Nó tạo phim nhanh, có âm thanh và hội thoại khớp từng chi tiết, duy trì nhân vật nhất quán khi có nhiều đoạn phim ghép lại với nhau. Ngoài ra, các khung hình, nhân vật hoặc cảnh nền cũng đồng bộ với nhân vật chính - điều hầu hết công cụ trước đó chưa làm được.

Tuy nhiên, một số lo ngại rằng với những gì Veo 3 đã thể hiện, AI có thể "cướp" công việc của con người, đặc biệt trong lĩnh vực đồ họa, dựng phim khi ngày càng được nâng cấp. Ngoài ra, theo một số chuyên gia, công cụ của Google có thể khiến nội dung "rác" xuất hiện ngày càng nhiều thời gian tới. Nghiêm trọng hơn, chúng có thể bị lợi dụng để tạo deepfake lừa đảo hoặc lan truyền thông tin sai lệch.

Trước vấn đề này, Google cho biết nội dung Veo 3 tạo ra đều được gắn nhãn qua watermark SynthID - công nghệ của Google DeepMind giúp xác định nội dung AI. Công ty cũng cung cấp hướng dẫn an toàn với mục tiêu "giúp mọi người tạo và xác định nội dung AI một cách có trách nhiệm".

Bảo Lâm


© 2025 | Tạp chí NƯỚC ĐỨC



 

Bài liên quan